RecherchearXiv cs.RO2h

Manipulation non préhensile orientée saisie par apprentissage d'un champ de préhensibilité

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié le 30 juin 2026 un preprint (arXiv:2606.30474) présentant une nouvelle approche de la manipulation non-préhensile orientée vers la saisie robotique. La manipulation non-préhensile désigne l'ensemble des techniques qui repositionnent un objet sans le saisir directement (poussée, glissement, basculement), typiquement utilisées comme étape préparatoire avant une prise ferme. L'innovation centrale est un "champ de saisissabilité" (graspability field) : au lieu de cibler une pose précise prédéfinie, le système apprend à mesurer, pour chaque configuration de l'objet, dans quelle mesure cette configuration est propice à une saisie réussie. Cette mesure scalaire dense sert de signal d'apprentissage pour un algorithme de renforcement (RL), et détermine automatiquement quand arrêter la phase de manipulation pour passer à la prise. Les expériences ont été conduites à la fois en simulation et sur un robot physique réel, confirmant que la politique apprise reconfigure fiablement les objets en états saisissables sans planificateur externe ni condition d'arrêt définie manuellement.

L'intérêt industriel de cette approche réside dans l'élimination d'une contrainte longtemps considérée comme incontournable : la nécessité de spécifier a priori une pose cible pour l'objet. En pratique, un intégrateur robotique sait qu'un objet doit être saisi, mais pas toujours dans quelle orientation exacte. En reformulant le problème comme optimisation d'un objectif de saisissabilité, les auteurs obtiennent un pipeline fermé piloté par une seule politique, sans recours à un planificateur de mouvement séparé. La corrélation mesurée entre la distance de saisissabilité prédite et le taux de succès de saisie réelle est un résultat notable : elle indique que la représentation apprise capture effectivement la faisabilité de la prise, et pas seulement un comportement émergent de la simulation.

La manipulation non-préhensile est un domaine de recherche classique en robotique, mais le couplage direct avec un objectif de saisissabilité apprend est une contribution plus récente, rendue possible par la maturité des méthodes RL appliquées à la manipulation. Ce travail s'inscrit dans une tendance plus large qui cherche à réduire le fossé simulation-réalité (sim-to-real gap) pour des tâches de manipulation fine, aux côtés d'approches comme les politiques de diffusion ou les architectures vision-langage-action (VLA). Aucune entreprise partenaire ni timeline de déploiement n'est mentionnée dans ce preprint purement académique. Les suites logiques incluent l'intégration de ce champ de saisissabilité dans des pipelines de manipulation industrielle multi-étapes et son couplage avec des modèles de fondation capables de raisonner sur des catégories d'objets variées.

Dans nos dossiers

IA physique & VLA arXiv cs.RO

À lire aussi

1arXiv cs.RO

DART : commande prédictive augmentée par apprentissage pour la manipulation bi-bras non préhensile

Des chercheurs ont publié sur arXiv (référence 2604.17833) les travaux autour de DART, un framework bimanuel conçu pour la manipulation non préhensile d'objets posés sur un plateau. L'approche repose sur un contrôleur prédictif non linéaire (MPC) couplé à un contrôleur d'impédance par optimisation, permettant de déplacer des objets sur le plateau sans les saisir directement. Le système évalue trois stratégies de modélisation de la dynamique plateau-objet : un modèle analytique physique, un modèle par régression en ligne adaptatif en temps réel, et un modèle de dynamique entraîné par apprentissage par renforcement (RL), ce dernier offrant une meilleure généralisation sur des objets aux propriétés variées. Les évaluations ont été réalisées en simulation sur des objets de masses, géométries et coefficients de friction différents. Les auteurs revendiquent que DART constitue le premier framework dédié à ce type de tâche en configuration bimanuelle. L'intérêt technique de DART réside dans la comparaison rigoureuse des trois approches de modélisation sur des métriques concrètes : temps de stabilisation, erreur en régime permanent, effort de contrôle et généralisation. Ce benchmark interne est utile pour les équipes d'intégration robotique qui doivent choisir entre modèles physiques (précis mais rigides), adaptation en ligne (réactive mais computationnellement coûteuse) et RL (flexible mais plus difficile à certifier). L'association MPC et contrôleur d'impédance est une piste crédible pour la manipulation d'objets fragiles ou instables, un verrou important en robotique de service. Toutefois, la validation reste strictement en simulation : le passage au réel implique des défis de perception, de latence et de calibration que le papier ne traite pas encore. Ce travail s'inscrit dans un intérêt croissant pour la robotique de service en hôtellerie et restauration, où des acteurs comme Bear Robotics (Servi), Keenon Robotics ou encore Enchanted Tools (Miroki, développé en France) positionnent leurs plateformes sur des tâches de transport et de service en salle. Les approches dominantes jusqu'ici privilégient la navigation autonome avec préhension classique ; la manipulation non préhensile sur plateau reste peu explorée à l'échelle produit. La prochaine étape naturelle pour DART serait une validation sur plateforme physique, avec des bras commerciaux type Franka Research 3 ou Universal Robots, avant d'envisager une intégration dans un robot mobile de service.

UEEnchanted Tools (Miroki, France) est cité comme acteur du service robotique susceptible de bénéficier de ce type de manipulation non préhensile sur plateau, mais le travail reste en simulation sans transfert réel annoncé.

RecherchePaper

1 source

2arXiv cs.RO

Apprentissage d'une manipulation en préhension stable dans un espace d'actions sans lâcher

Des chercheurs ont publié en juin 2026 sur arXiv (arXiv:2606.28196v1) une approche pour apprendre à un bras robotique à manipuler des objets en main de façon stable, sans les lâcher. Le problème ciblé est l'in-grasp manipulation : repositionner ou réorienter un objet tenu dans la pince sans l'échapper, une capacité jugée critique pour les mains dextres multi-doigts. Leur contribution principale est un espace d'action dit "non-dropping", qui contraint structurellement l'exploration du contrôleur pour éliminer les trajectoires conduisant à la chute. Sur cet espace, chaque sous-compétence de manipulation dextre est décomposée en composantes simples et analysables, puis entraînée séparément avec des contraintes issues de la physique classique et de la théorie du contrôle. Les expériences couvrent différentes géométries d'objets, niveaux de bruit moteur et sensoriel, latences de communication, et conditions de friction. L'intérêt industriel de ce travail tient à une limite bien connue du reinforcement learning appliqué à la manipulation : l'inefficacité de l'exploration en bout en bout lorsque les objectifs d'apprentissage entrent en conflit ou que les instabilités passent inaperçues pendant l'entraînement. En injectant des priors de physique et de contrôle au niveau de la structure du problème plutôt qu'en récompense floue, les auteurs réduisent le besoin en simulation massive et accélèrent la convergence. Pour un intégrateur ou un ingenieur système, cela signifie potentiellement des contrôleurs de préhension plus robustes aux variabilités de terrain sans recourir à des millions d'itérations de sim-to-real. L'approche s'inscrit dans la tendance "physics-informed RL" qui cherche à corriger le manque d'échantillonnage des méthodes purement agnostiques. L'in-grasp manipulation reste un problème ouvert depuis les travaux fondateurs sur les mains Shadow et DLR Hand au début des années 2000. Récemment, des équipes comme OpenAI (Rubik's Cube, 2019) ou Google DeepMind (ALOHA / DexteritY) ont démontré des progrès en RL pur, mais souvent au prix de temps d'entraînement prohibitifs ou de contextes très contraints. Ce préprint ne provient pas d'une entreprise identifiée dans l'abstract et aucune affiliation institutionnelle n'est mentionnée dans l'extrait disponible. Aucun déploiement réel ni partenariat industriel n'est annoncé : il s'agit d'une contribution académique en phase de revue, dont les suites dépendront de la publication complète et d'éventuelles validations sur hardware physique.

RecherchePaper

1 source

3arXiv cs.RO

ForceBand : apprentissage de la manipulation de force par sEMG

Une équipe de chercheurs a présenté ForceBand, un bracelet sEMG (électromyographie de surface) porté au poignet et conçu pour enrichir les démonstrations humaines destinées à l'apprentissage de politiques de manipulation robotique. Le système capture l'activité musculaire du poignet via des électrodes de surface et, combiné à une IMU, alimente un modèle pré-entraîné baptisé EMG2Force qui prédit les forces exercées par chaque doigt. Pour entraîner ce modèle, les chercheurs ont constitué un jeu de données multimodal de 10 heures combinant vidéo égocentrique, signaux sEMG, données inertielles et mesures de forces au bout des doigts, couvrant des actions et objets variés. Après une courte calibration propre à l'utilisateur, celui-ci peut collecter de nouvelles démonstrations avec seulement le bracelet et une caméra : EMG2Force étiquette automatiquement ces séquences avec les traces de force par doigt. Les expériences rapportent une réduction d'erreur de prédiction de force supérieure à 50 % par rapport aux baselines fondées uniquement sur la vision, et un taux de succès de 87 % sur des tâches de saisie, compression et dépose impliquant des objets de formes, tailles et poids variés. L'apport clé de ForceBand réside dans la résolution d'un angle mort structurel des pipelines d'imitation learning : les sources courantes de démonstrations humaines, capture de mouvement ou vidéos internet, fournissent trajectoire et apparence mais ignorent les forces de contact, pourtant déterminantes pour toute manipulation sensible au toucher. Serrer un emballage souple sans l'écraser, insérer un connecteur, manipuler des objets fragiles ou déformables sont des tâches où le contrôle en effort prime sur le contrôle en position. En rendant ces forces observables à faible coût matériel, le système ouvre la voie à des politiques VLA (vision-language-action) capables de généraliser sur des propriétés mécaniques d'objets non vus, sans capteurs de force onéreux montés sur le robot. Ce travail s'inscrit dans une dynamique active autour de l'augmentation des données de démonstration : plusieurs laboratoires explorent des gants haptiques, des capteurs tactiles intégrés aux mains robotiques ou des méthodes de reconstruction de force par vision stéréo. ForceBand se positionne comme une alternative légère et bon marché, accessible sans infrastructure de motion capture. L'article est pour l'instant un preprint arXiv (2606.26093), non encore soumis à une conférence majeure, et les résultats reposent sur un protocole contrôlé en laboratoire. La robustesse au bruit musculaire inter-sujets, à la fatigue et aux variations de placement du bracelet en conditions industrielles reste à démontrer. Les prochaines étapes naturelles impliqueront des tests sur des robots à mains dextrères (dexterous hands) et une validation sur des tâches d'assemblage réelles, là où la complémentarité avec des plateformes comme les mains Allegro ou Shadow est la plus directe.

RecherchePaper

1 source

4arXiv cs.RO

Manipulation souple par poussée non-préhensile

Des chercheurs ont publié sur arXiv (2605.25672) une méthode permettant à un bras manipulateur de pousser des objets en milieu humain sans les saisir, tout en maintenant une compliance passive. L'approche étend un modèle de poussée existant intégré à un contrôle en impédance, puis construit un cadre de commande prédictive (MPC) qui module conjointement position et vitesse du robot pour produire la force de contact voulue et adapter le point de contact selon la trajectoire désirée de l'objet. Un filtre de passivité basé sur un "energy tank" module ensuite la vitesse de référence pour éviter l'accumulation incontrôlée d'énergie lors d'interactions extérieures imprévues. La méthode a été validée en simulation puis expérimentalement sur deux systèmes robotiques physiques distincts. Ce travail répond à un besoin croissant dans la robotique collaborative: déplacer des objets sans préhension dans des espaces humains sans risquer de blesser un opérateur en cas de contact non planifié. La plupart des approches MPC pour la manipulation par poussée supposent un robot rigide, ce qui les rend inadaptées aux environnements partagés. En combinant impédance et passivité, cette méthode ouvre la voie à des manipulateurs opérant en mode "open floor" dans des entrepôts ou sur des lignes d'assemblage. Le mécanisme d'energy tank, issu de la robotique haptique, applique ici un principe de stabilité éprouvé à la manipulation non-préhensile. Limite notable: le papier ne fournit pas de métriques de cycle time ni de masse utile testée en conditions réalistes, ce qui limite les conclusions directes pour les intégrateurs industriels. Ce développement s'inscrit dans un champ actif où des équipes comme celles de Berkeley (pushing as pre-grasp manipulation) et d'ETH Zurich (planar pushing) ont posé les bases théoriques; la brique compliance manquait pour un transfert industriel crédible. Côté commercial, la manipulation sans préhension reste peu déployée: Righthand Robotics et Covariant privilégient la préhension adaptative, tandis que des solutions de poussée planaire existent dans les AMR mais sans bras articulé compliant. En France, les acteurs logistiques comme Exotec restent dépendants de la préhension pour la manipulation fine d'objets. La prochaine étape naturelle serait une validation sur scénario d'entrepôt réel avec un spectre plus large de géométries et masses d'objets, perspective que les auteurs mentionnent explicitement.

UELes acteurs logistiques européens comme Exotec pourraient à terme bénéficier de cette approche pour réduire leur dépendance à la préhension fine en entrepôt, mais l'absence de métriques industrielles réalistes retarde tout transfert opérationnel.

RecherchePaper

1 source