Dossier Manipulation robotique

675 articles

La manipulation robotique : pinces dextres, peau électronique, grasping, benchmarks de tâches fines, le goulot d'étranglement principal des humanoïdes.

Figure 1X Technologies Tesla Optimus Boston Dynamics Unitree AgiBot Apptronik Apollo Agility Robotics — Digit UBTech Fourier Intelligence Sanctuary AI Wandercraft Tous les dossiers →

1arXiv cs.RO RecherchePaper

Cadre de politique adaptatif au contexte pour une manipulation robotique robuste et réactive via apprentissage par imitation sensible à l'incertitude

Une nouvelle version (v2) de l'article arXiv:2410.24035 propose un cadre de politique adaptatif au contexte pour la manipulation robotique, combinant robustesse et réactivité. Les auteurs s'appuient sur l'apprentissage par démonstration (Learning from Demonstration, LfD), et plus précisément sur les approches basées sur des systèmes dynamiques (DS), pour apprendre une politique conditionnée à la fois par l'état du robot et par des paramètres de tâche de basse dimension représentant le contexte environnant. Cette politique est ensuite combinée à des politiques additionnelles sensibles à l'incertitude via une formulation de type mélange d'experts (Mixture of Experts, MoE). Le système est validé sur le jeu de données de référence LASA handwriting, utilisé classiquement pour évaluer l'apprentissage de trajectoires, ainsi que sur un robot réel à 7 degrés de liberté (7-DoF), dans trois scénarios concrets : la saisie conditionnée par la force appliquée, la manipulation d'aliments déformables, et la saisie centrée sur l'objet. L'enjeu technique visé est précis : les approches DS de l'état de l'art excellent généralement en robustesse mais restent rigides face aux variations de contexte, car elles ne modulent pas leur comportement selon des variables dépendantes de la tâche. En articulant fusion de politiques et quantification d'incertitude, ce cadre cherche à améliorer le comportement hors distribution (out-of-distribution) et la convergence des trajectoires générées, deux propriétés critiques pour tout déploiement en environnement réel non contrôlé. Pour les intégrateurs robotiques, l'intérêt pratique tient surtout à la manipulation d'objets déformables, un cas d'usage encore mal résolu dans l'industrie (agroalimentaire, logistique), et à la promesse d'une politique réutilisable sans réentraînement complet à chaque changement de tâche ou d'environnement. Sur le plan du contexte scientifique, le LfD via systèmes dynamiques est un axe de recherche établi depuis plusieurs années pour produire des politiques de contrôle réactives en robotique. Ce travail se positionne comme une extension de recherches antérieures sur la fusion de politiques et l'estimation d'incertitude, plutôt que comme une rupture méthodologique. L'abstract ne mentionne ni laboratoire ni entreprise associée, et il s'agit d'une publication académique (statut « replace », donc une révision d'un article déjà soumis) sans indication de déploiement industriel à ce stade.

Dossier Manipulation robotique

Cadre de politique adaptatif au contexte pour une manipulation robotique robuste et réactive via apprentissage par imitation sensible à l'incertitude

FIRMGrasp : une marge de risque tenant compte du frottement pour une synthèse de prise robuste

La malédiction de la précision : une loi d'échelle des données pour la manipulation robotique de haute précision

ViTacWorld : passage à l'échelle des modèles du monde visuo-tactiles pour la manipulation robotique riche en contacts

AXIS : un moteur de données communautaire évolutif pour la manipulation robotique à grande échelle

RoboInter1.5 : une suite de représentations intermédiaires holistiques pour la modélisation du monde incarné et la manipulation robotique

Frottement clé pour améliorer les modèles du monde des robots

Robot en trompe d'éléphant : une caméra interne pour un sens du toucher

VTAP : combiner détection au bout des doigts et paume active visuo-tactile pour la manipulation dextérique en main

Structure continûment stable par déformation plastique

Robot industriel d'évaluation de dextérité : une plateforme matérielle et logicielle pour le benchmarking de la manipulation dextre industrielle

DECO : transformateur de diffusion multimodal découplé pour la manipulation dextre bimanuelle avec adaptateur tactile enfichable

L'efficacité du fine-tuning LoRA pour les modèles vision-langage-action dans la manipulation robotique industrielle

D'observateur passif à critique actif : l'apprentissage par renforcement révèle un raisonnement de processus pour la manipulation robotique

Tesollo lance le processus d'introduction en bourse tout en développant des mains humanoïdes

RoboDojo : un benchmark unifié simulation-réel pour évaluer les politiques de manipulation robotique généralistes

Apprentissage de la manipulation dextérique via guidage par couple de contact issu de démonstrations humaines

Combinaison d'échantillonnage contraint et d'apprentissage par renforcement pour la manipulation robotique

De la préhension à la dextérité : pré-entraînement à grande échelle pour la manipulation dextérique

LDHP : planification hiérarchique pilotée par bibliothèque pour la manipulation dextérique non préhensile

Eval-Actions : évaluation fine de la qualité d'exécution en manipulation robotique

Erreur quadratique sur intervalle critique : vers une validation hors ligne fiable des politiques de manipulation robotique

Ancrage de la généralisation simulation-réel en manipulation robotique : étude empirique avec des modèles VLA

Lois d'échelle des données en apprentissage par imitation pour la manipulation robotique

WatchAct : un benchmark de manipulation robotique fondée sur le comportement

Amélioration du fine-tuning des modèles VLA par supervision structurée des étapes et des images clés

Représentations centrées sur l'objet pour une meilleure généralisation en manipulation robotique

Apprentissage de priors d'action pour la manipulation robotique multi-morphologies

Contrôle prédictif événementiel piloté par les données via apprentissage par renforcement profond pour un bras souple à câbles 3D

Modèles du monde pour la manipulation robotique

L'affinage des modèles vision-langage-action (VLA) nécessite moins de couches qu'on ne le pense

Mem-World : modèles du monde conditionnés par l'action et augmentés par la mémoire pour la manipulation robotique persistante

Sanctuary AI valide les performances de son IA physique chez un équipementier automobile de rang 1

Rapport technique Qwen-RobotManip : l'alignement permet le passage à l'échelle des modèles fondation pour la manipulation robotique

AnnotateAnything : annotation automatique d'objets 3D pour la manipulation robotique

EAGG : génération de saisie alignée sur l'embodiment par conditionnement géométrique sur graphe

SimTO : un cadre d'optimisation topologique en deux étapes, piloté par simulation, pour pinces robotiques souples sur mesure

T-Rex : manipulation dextérique à réaction tactile

DragMesh-2 : interaction main-objet dextérique physiquement plausible avec des objets articulés

PhysVLA : vers un modèle VLA physiquement ancré pour la manipulation robotique

ReactVLA : manipulation robotique rapide et légère par génération d'actions Mean Flow améliorée

ORCA : une plateforme open source pour la recherche en dextérité

WEAVER, meilleur, plus rapide, plus long : un modèle du monde efficace pour la manipulation robotique

FTP-1 : une politique fondation généraliste pour la manipulation en contact, compatible tous capteurs tactiles

Vers une préhension séquentielle fiable d'objets en environnement encombré : solution finaliste du RGMC 2025

À l'intérieur de XRZero-G0, un nouveau jeu de données ouvert de 2 000 heures pour la recherche en robotique

Combler le fossé morphologique : adapter les modèles VLA à la manipulation dextérique par ajustement conditionné par l'intention

Capteur tactile déformable en main avec détection intégrée du glissement, de la vitesse, force/couple et carte de pression

UniDexTok : un tokeniseur unifié pour mains dextériques à partir de données réelles

UMI-Bench 1.0 : un benchmark ouvert et reproductible pour la manipulation robotique de surface avec données UMI