Glissement d'objets par manipulation des pieds…

HeLoM : apprentissage hiérarchique pour la locomotion et la manipulation corps entier par un robot hexapode

35

1arXiv cs.RO

HeLoM : apprentissage hiérarchique pour la locomotion et la manipulation corps entier par un robot hexapode

Des chercheurs ont publié sur arXiv (arXiv:2509.23651v3) HeLoM, un framework hiérarchique d'apprentissage pour la manipulation whole-body par un robot hexapode. L'objectif central est la manipulation non-préhensile, c'est-à-dire pousser des objets sans les saisir, une stratégie qui contourne la complexité de la conception de prises tout en exploitant le contact direct pour contrôler la pose d'un objet. Le système repose sur une architecture à deux niveaux : un planificateur haut niveau qui définit les comportements de poussée, et un contrôleur bas niveau qui maintient la stabilité locomotrice et génère des commandes articulaires dynamiquement cohérentes. En pratique, les pattes avant assurent l'interaction avec l'objet tandis que les pattes arrière fournissent la propulsion. Les expériences en monde réel montrent que le robot peut pousser des objets de tailles et propriétés physiques variées, et a priori inconnues, vers des poses cibles définies. L'intérêt de HeLoM pour le secteur robotique tient à deux points. Premièrement, il démontre qu'un système hexapode peut réaliser une manipulation efficace sans bras ni préhension, en mobilisant la totalité de la cinématique du corps, une approche qui s'applique par extension à d'autres plateformes multi-pattes. Deuxièmement, la robustesse face aux propriétés inconnues de l'objet (masse, forme irrégulière) illustre un progrès sur le gap sim-to-real : le framework, validé en simulation, transfère dans le monde physique sans connaissance a priori des paramètres de l'objet. Pour un intégrateur industriel, cela signifie potentiellement une manipulation de charges lourdes ou encombrantes sans recourir à un bras robotique dédié. L'approche s'inscrit dans un courant plus large de recherche sur la loco-manipulation whole-body, où des laboratoires comme ETH Zurich (ANYmal), Carnegie Mellon (loco-manipulation quadrupède) et Boston Dynamics travaillent à unifier locomotion et manipulation dans un cadre unique. HeLoM se distingue en ciblant spécifiquement l'hexapode, morphologie plus stable mais moins explorée que le quadrupède pour la manipulation. La publication est un preprint arXiv (version 3), sans mention de déploiement industriel ni de partenariat. Les prochaines étapes naturelles seraient l'extension à des comportements de tirage ou de levage, et des tests sur des charges plus importantes avec mesure explicite du payload maximal, absent des résultats actuellement publiés.

RecherchePaper

1 source

ContactMimic : interaction avec des objets par un robot humanoïde grâce au contrôle des contacts

40

2arXiv cs.RO

ContactMimic : interaction avec des objets par un robot humanoïde grâce au contrôle des contacts

Wiping a board, sitting on a chair ou pousser un meuble : ces tâches semblent réussies dès que le robot atteint la bonne posture, mais sans contact physique réel avec l'objet, elles échouent en pratique. C'est le constat de départ de CONTACTMIMIC, un framework d'apprentissage présenté dans un article publié le 10 juillet sur arXiv (2607.08742). L'équipe y ajoute aux trajectoires de points-clés classiques (keypoint tracking) des commandes de contact binaires, définies au niveau de chaque partie du corps. La politique résultante s'appuie sur deux ingrédients : des récompenses qui suivent explicitement le contact et un schéma d'augmentation de trajectoires conçu pour casser la corrélation entre géométrie des points-clés et étiquettes de contact. Résultat, le robot peut produire ou supprimer un contact à la demande, indépendamment de sa pose. Sur 10 mouvements d'interaction homme-objet testés en simulation, CONTACTMIMIC dépasse les trackers uniquement basés sur les points-clés, sans recourir à des récompenses spécifiques à chaque tâche. Le transfert sim-to-real a été validé sur 5 mouvements réels. L'enjeu dépasse la démonstration technique : la plupart des pipelines d'imitation de mouvement pour humanoïdes optimisent la fidélité cinématique, pas l'interaction physique effective, un angle mort qui limite l'utilité pratique des politiques de manipulation whole-body déployées sur des plateformes comme Figure 03, Optimus ou des architectures VLA type GR00T N2, Pi-0 ou Helix. Découpler contact et géométrie ouvre la voie à des contrôleurs capables d'exécuter des tâches ménagères ou industrielles réelles (essuyer, pousser, s'asseoir) sans réentraînement par tâche, un prérequis pour que les humanoïdes sortent de la démonstration scriptée. Le travail s'inscrit dans la lignée des méthodes de suivi de points-clés pour le contrôle corps entier des humanoïdes, dont il expose les limites via des ablations confirmant la nécessité de l'augmentation de trajectoires. Aucun partenaire industriel n'est mentionné : il s'agit pour l'instant d'une contribution de recherche en simulation et validation restreinte en réel, dont les vidéos sont disponibles en ligne, sans calendrier de déploiement annoncé.

RecherchePaper

1 source

GHOST : politiques hiérarchiques à sous-objectifs pour généraliser la manipulation robotique

42

3arXiv cs.RO

GHOST : politiques hiérarchiques à sous-objectifs pour généraliser la manipulation robotique

Des chercheurs ont publié le 10 juin 2026 un preprint arXiv (2606.10025) présentant GHOST, un framework pour politiques visuomotrices de manipulation robotique capables de généraliser au-delà de leur distribution d'entraînement. L'architecture repose sur une factorisation hiérarchique en deux niveaux : une politique haut niveau qui prédit le prochain sous-objectif sous forme de distribution sur les poses 3D de l'effecteur terminal à partir d'observations RGB-D multi-vues, et un contrôleur bas niveau conditionné sur ces objectifs qui génère les actions spécifiques à l'embodiment physique du robot. Pour relier les deux niveaux, les auteurs introduisent une interface spatiale qui projette les sous-objectifs 3D prédits dans le plan image sous forme de heatmaps de l'effecteur, une représentation volontairement simple mais compatible avec les pipelines d'entraînement existants. La politique haut niveau est entraînée sur des vidéos de démonstrations humaines brutes, sans retargeting d'actions, tandis que la politique bas niveau reste entraînée exclusivement sur des données robot. Le résultat central est que cette décomposition hiérarchique améliore systématiquement les performances et la robustesse par rapport à une Diffusion Policy plate (architecture de référence populaire depuis les travaux de Chi et al. en 2023) sur une suite de tâches de manipulation. L'insight clé est que les sous-objectifs en espace cartésien de l'effecteur sont largement "embodiment-agnostic" : la même politique haut niveau peut s'appliquer à différentes architectures de robots sans réentraînement complet. Cela contourne un goulot d'étranglement majeur dans le domaine, le retargeting d'actions depuis les démonstrations humaines, qui introduit habituellement un bruit significatif et limite la qualité des données d'entraînement. GHOST s'inscrit dans un courant actif de recherche sur l'utilisation des vidéos humaines comme source de supervision low-cost pour la robotique de manipulation, aux côtés d'approches comme pi-0 de Physical Intelligence ou des travaux sur les VLA (Visual-Language-Action models) de Google DeepMind avec RT-2 et GR00T N2 de NVIDIA. La principale limitation à noter : il s'agit d'un preprint non encore peer-reviewed, sans données de déploiement réel ni métriques de cycle time en contexte industriel. Les résultats concernent une suite de tâches de laboratoire ; la tenue à l'échelle dans des environnements moins contrôlés reste à démontrer. Aucun partenariat industriel ni timeline de commercialisation n'est annoncé.

RecherchePaper

1 source

HCLM : un cadre hiérarchique pour la loco-manipulation coopérative avec deux quadrupèdes

35

4arXiv cs.RO

HCLM : un cadre hiérarchique pour la loco-manipulation coopérative avec deux quadrupèdes

Des chercheurs présentent HCLM (Hierarchical Cooperative Loco-Manipulation), un framework de contrôle pour deux robots quadrupèdes réalisant des tâches de manipulation d'objets en coopération, publié sur arXiv (2605.17300) en mai 2025. L'architecture combine une Joint Diffusion Policy centralisée au niveau supérieur, exploitant une représentation SE(3)-invariante de l'espace de tâche pour apprendre des patterns de coordination indépendants du référentiel géométrique des robots, et un Whole-Body Controller hybride au niveau inférieur. Ce WBC associe un MPC cinématique proactif pour distribuer les vitesses sans collision à une couche réactive assurant le suivi précis de l'effecteur terminal. Un schéma d'admittance coopérative régule les forces internes lors des interactions en chaîne fermée, c'est-à-dire quand les deux robots portent simultanément le même objet. Le framework est validé en simulation sur trois tâches de difficulté croissante (transport coopératif, conditionnement, transfert d'objet) et déployé physiquement pour la tâche de transfert uniquement. Ce travail adresse un verrou technique de la manipulation multi-robots sur bases flottantes : concilier coordination spatiale, locomotion robuste et contraintes physiques imposées par les interactions en chaîne fermée, où deux robots tenant le même objet génèrent des stresses internes potentiellement destructeurs. La décomposition hiérarchique découple le raisonnement collaboratif de haut niveau de l'exécution motrice, isolant les problèmes pour les résoudre indépendamment. L'invariance SE(3) de la politique de diffusion est le résultat le plus structurant, permettant une généralisation à des configurations géométriques non vues lors de l'entraînement. Les expériences reportent une robustesse aux perturbations physiques sévères, bien que les benchmarks restent limités à des scénarios de laboratoire soigneusement sélectionnés, sans mesures comparatives tierces. La manipulation coopérative sur quadrupèdes mobiles demeure un sous-domaine académique sans déploiement industriel annoncé. Les quadrupèdes à bras embarqués, ANYmal d'ANYbotics ou Spot de Boston Dynamics instrumentés en labo, constituent le banc de test dominant pour ces recherches. Les approches concurrentes traitent généralement locomotion et manipulation séparément, ou se limitent à un seul agent mobile. HCLM se distingue par la gestion explicite des interactions en chaîne fermée entre deux robots mobiles simultanément en contact avec l'objet, un scénario sous-traité dans la littérature existante. Le papier ne mentionne aucun partenariat industriel ni timeline de commercialisation, et reste une contribution académique avec déploiement physique partiel.

RecherchePaper

1 source

Glissement d'objets par manipulation des pieds sur un robot bipède à roues avec contrôle hiérarchique

À lire aussi

HeLoM : apprentissage hiérarchique pour la locomotion et la manipulation corps entier par un robot hexapode

ContactMimic : interaction avec des objets par un robot humanoïde grâce au contrôle des contacts

GHOST : politiques hiérarchiques à sous-objectifs pour généraliser la manipulation robotique

HCLM : un cadre hiérarchique pour la loco-manipulation coopérative avec deux quadrupèdes