RecherchearXiv cs.RO 21 avril 2026

MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs du MMlab (Hong Kong) ont publié les spécifications complètes de MM-Hand, une main robotique à actionnement tendineux déporté dotée de 21 degrés de liberté (DOF). L'architecture centrale repose sur la délocalisation des moteurs vers la base du robot ou un hub moteur externe, les tendons transitant par des gaines flexibles jusqu'aux doigts. La main intègre des doigts à retour par ressort, des structures palmaire et digitale modulaires imprimées en 3D, des connecteurs tendineux à remplacement rapide, ainsi qu'un système de captation multimodale comprenant des encodeurs articulaires, des capteurs tactiles, un retour d'effort côté moteur, et une caméra stéréo embarquée dans la paume. Les expériences publiées rapportent une force de 25 N en bout de doigt via une transmission tendon-gaine d'un mètre, et les essais en boucle fermée ont été conduits aussi bien bras statique que bras en mouvement. L'ensemble des designs matériels et logiciels est publié en open source.

Ce travail s'attaque à un verrou classique de la manipulation dextère à haute densité de DOF : l'encombrement thermique et massique des actionneurs embarqués dans la main. En déportant les moteurs, MM-Hand libère le volume intra-main pour des capteurs et des mécanismes supplémentaires, ce qui change concrètement l'équation pour les laboratoires de recherche en manipulation. La combinaison vision stéréo palmaire et toucher tactile dans un seul effecteur ouvre la voie à des politiques d'apprentissage multimodal (VLA, diffusion policies) sans avoir à multiplier les capteurs externes. La publication open source de la mécanique et du firmware est un signal fort : les auteurs misent sur la réplication communautaire pour valider le passage à l'échelle, ce que les démonstrations en laboratoire seul ne peuvent pas prouver.

MM-Hand s'inscrit dans un effort plus large d'industrialisation de la main robotique dextère, un segment où l'on retrouve Shadow Robotics (UK, 24-DOF, câbles), Inspire Robots (Chine, utilisée sur Unitree H1 et G1) et Wonik Robotics (Allegro Hand, 16-DOF, courroies). La différenciation revendiquée de MM-Hand est sa maintenabilité modulaire et son coût de reproduction accessible via impression 3D. Le MMlab n'a pas annoncé de partenariat industriel ni de feuille de route de commercialisation : il s'agit pour l'instant d'une plateforme de recherche publiée, pas d'un produit shipé.

Impact France/UE

Les laboratoires européens de recherche en manipulation dextère peuvent répliquer MM-Hand grâce à la publication open source complète (mécanique + firmware), mais aucun partenariat ni déploiement européen n'est annoncé par le MMlab.

Dans nos dossiers

Unitree

À lire aussi

1arXiv cs.RO

Modélisation dynamique hybride d'un bras robotique flexible à 2 degrés de liberté

Une équipe de chercheurs a soumis sur arXiv (référence 2606.02969) une étude comparant trois méthodes de modélisation dynamique pour un bras robotique à 2 degrés de liberté (2-DoF) à liaisons flexibles. Deux approches dites "physics-informed" combinent des formulations de dynamique corps-rigide (RBD) avec un modèle de mélange gaussien (GMM) pour capturer les erreurs résiduelles et la flexibilité mécanique des segments. Une troisième approche, purement data-driven, sert de référence via régression cinématique. Sur un jeu de données open-source, les prédictions de couple ont été estimées par régression Ridge sur des variables cinématiques ; le modèle physique de référence a été construit à partir des spécifications constructeur publiées, puis une version alternative a estimé les mêmes paramètres directement par moindres carrés ordinaires (OLS). Résultat central : les paramètres issus des fiches techniques affichent la moins bonne précision, tandis que les estimateurs Ridge et OLS s'alignent significativement mieux avec les couples mesurés. Ce résultat fragilise une hypothèse répandue en robotique industrielle : que les modèles analytiques construits à partir des spécifications constructeur constituent une base fiable pour la commande ou la simulation. Pour les bras à liaisons flexibles, les déformations mécaniques sous charge introduisent des dynamiques non modélisées que les formulations corps-rigide classiques ignorent, creusant un écart mesurable entre modèle et réalité. L'étude démontre que la régularisation et l'identification directe par données comblent ces lacunes plus efficacement que les paramètres physiques bruts. Pour un intégrateur ou un ingénieur concevant des contrôleurs pour robots légers, cobots ou bras à câbles, cela implique concrètement de recalibrer les paramètres dynamiques sur des mesures in situ plutôt que de faire confiance aux valeurs datasheet. Le travail appuie également le développement des méthodes semi-paramétriques de "residual learning", qui associent un modèle physique imparfait à un correcteur appris, évitant ainsi le choix binaire entre approche analytique et approche purement données. La modélisation des robots à liaisons flexibles est un problème de recherche actif depuis plusieurs décennies, devenu particulièrement stratégique avec la montée des cobots et des manipulateurs légers dont les segments se déforment sous charge. Ce travail s'inscrit dans un mouvement plus large vers les réseaux physics-informed (PINN) et les méthodes hybrides physique-apprentissage. En Europe, plusieurs équipes travaillent sur des architectures similaires pour robots à câbles et manipulateurs souples. L'un des atouts de cette étude est d'utiliser un jeu de données ouvert, ce qui en fait une référence utilisable pour benchmarker de nouvelles approches. La suite logique est l'intégration de ces modèles hybrides dans des boucles de commande temps réel et leur extension à des architectures à plus de degrés de liberté.

UELes équipes européennes développant des cobots et manipulateurs légers peuvent appliquer directement la recommandation de recalibrer les paramètres dynamiques par identification in situ plutôt que de se fier aux fiches constructeur.

RecherchePaper

1 source

2arXiv cs.RO

S-Cheetah : un robot quadrupède innovant avec une colonne vertébrale active à 3 degrés de liberté pour une locomotion agile

Des chercheurs du laboratoire Himmy Robotics ont présenté S-Cheetah, un robot quadrupède doté d'une colonne vertébrale active à 3 degrés de liberté (DOF) reproduisant la flexion sagittale, la flexion latérale et la rotation axiale des félins. Publié le 28 mai 2026 sur arXiv (preprint 2605.27909), le système atteint 6,9 m/s en galop rotatif G2 et un taux de rotation sur place de 7,2 rad/s. Pour exploiter pleinement cette architecture mécanique, l'équipe a développé un framework d'apprentissage par renforcement (RL) combinant un curriculum d'accélération progressive et des fonctions de récompense spécifiques : récompense de galop, d'ondulation spinale et de direction spinale. Le robot exhibe également une capacité émergente de redressement aérien inspirée des félins, atterrissant sur ses quatre pattes depuis n'importe quelle orientation en chute libre. La majorité des robots quadrupèdes intègrent aujourd'hui des colonnes actives à 1 ou 2 DOF pour limiter la complexité de contrôle, sacrifiant ainsi la richesse de mouvement observée chez les animaux biologiques. S-Cheetah tente de combler cet écart : un spine tri-axial complet avait jusqu'ici été évité car il complique radicalement la planification du mouvement. Le principal apport technique réside dans le fait que le framework RL force l'engagement actif de la colonne plutôt que de la laisser passive. La capacité de redressement aérien, non programmée explicitement mais émergente, renforce la thèse que des curricula de récompense bien construits peuvent capturer des dynamiques corporelles complexes et réduire le sim-to-real gap pour des architectures mécaniques atypiques. S-Cheetah s'inscrit dans la lignée du MIT Cheetah, d'ANYmal (ETH Zurich / ANYbotics) et des plateformes Unitree (B2, Go2), dont la plupart utilisent un tronc rigide ou une articulation spinale à 1 DOF. Ce travail reste un preprint non encore évalué par les pairs, sans pilote industriel ni commercialisation annoncés. Les performances proviennent de tests en laboratoire et les vidéos sélectionnées ne permettent pas encore d'évaluer la robustesse en conditions réelles non structurées. Les prochaines étapes, selon la page projet himmy-robotics.github.io/scheetah, devraient porter sur des tâches locomotrices plus complexes et des évaluations en environnement extérieur.

RecherchePaper

1 source

3arXiv cs.RO

HiMem-WAM : modèles d'action-monde à mémoire hiérarchique pour la manipulation robotique

Une équipe de recherche a déposé sur arXiv (2606.10363v1) HiMem-WAM, un nouveau modèle d'action hiérarchique pour la manipulation robotique. L'architecture s'attaque à une limitation persistante des World Action Models (WAM) existants : leur incapacité à maintenir une mémoire de tâche cohérente sur des séquences longues, typiques des manipulations multi-étapes. HiMem-WAM combine trois mécanismes : des actions latentes centrées sur le mouvement (niveau bas), des latents de compétences de haut niveau, et une porte mémoire déclenchée aux transitions de compétences prédites. Ce verrou mémoire écrit des états compacts à des moments-clés, permettant l'inférence causale sans génération vidéo ni estimation de flux optique au moment du test. Le modèle a été évalué sur les benchmarks LIBERO, LIBERO-PLUS et RMBench, ainsi que sur des tâches en conditions réelles. La contribution principale est d'ordre systémique : la structuration hiérarchique améliore la robustesse sous perturbations lors du déploiement, là où la plupart des architectures VLA actuelles échouent dès qu'un événement imprévu survient en milieu de séquence. Pour un décideur industriel, c'est un signal pertinent : le module mémoire apporte, selon les auteurs, un gain substantiel sur les tâches longues dépendantes de l'historique d'action. Éviter la génération vidéo en temps d'inférence réduit également la latence et la charge computationnelle, deux freins réels au déploiement embarqué. Ces résultats restent toutefois issus d'un preprint non peer-reviewed, et les performances sur benchmarks standardisés ne garantissent pas les mêmes gains en environnement de production non contrôlé. Les World Action Models constituent un paradigme récent qui apprend les dynamiques visuelles pertinentes pour l'action, distinct des architectures VLA classiques comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, lesquelles s'appuient sur des transformers multimodaux de grande taille. La manipulation longue-horizon reste un défi ouvert pour l'ensemble du secteur : ni les diffusion-policies ni les modèles language-conditioned n'ont résolu le maintien du contexte sur des séquences dépassant une dizaine de sous-tâches. HiMem-WAM propose une piste architecturale concrète, mais sans intégration hardware annoncée ni timeline de déploiement, ce qui en fait pour l'instant une contribution de recherche fondamentale.

RechercheOpinion

1 source

4arXiv cs.RO

Clonage comportemental de la commande prédictive pour manipulateurs robotiques à 3 degrés de liberté

Une équipe de chercheurs présente dans un preprint arXiv (2606.00383, soumis début juin 2026) une étude empirique sur l'application du Behavior Cloning pour approximer les politiques de commande prédictive par modèle (MPC) sur un manipulateur robotique à 3 degrés de liberté (DOF). Le principe : entraîner un réseau de neurones à imiter le comportement d'un contrôleur MPC classique, couplé à de la cinématique inverse, afin de produire une politique de substitution nettement moins coûteuse en calcul. Plusieurs architectures ont été évaluées, des régresseurs classiques aux réseaux profonds (Deep MLP) en passant par des architectures récurrentes (RNN), selon des protocoles d'évaluation en ligne et hors ligne. Le meilleur résultat atteint une réduction de latence d'inférence d'un facteur 3 par rapport au MPC original, avec un taux de succès de 84,98 % sous tolérances relâchées. Point notable : les architectures statiques (MLP) surpassent les variantes temporelles (RNN), ce qui suggère que l'observation instantanée de l'état est suffisante pour cette tâche. Ce résultat est significatif pour les systèmes embarqués temps réel, où le MPC est souvent jugé trop gourmand en ressources pour tourner en boucle fermée sur du matériel contraint. La distillation de politique MPC via l'imitation ouvre la voie à des contrôleurs légers déployables sur des microcontrôleurs ou des SoC industriels sans sacrifier l'essentiel de la qualité de trajectoire. Cependant, la réserve éditoriale s'impose : les 84,98 % de succès sont mesurés sous tolérances relâchées. Sous tolérances strictes, les auteurs observent un écart de précision résiduel, notamment sur l'erreur en régime permanent, ce qui limite pour l'instant l'applicabilité à des tâches d'assemblage de haute précision. Le Behavior Cloning appliqué au contrôle de bras robotiques s'inscrit dans un courant plus large de distillation de contrôleurs optimaux vers des politiques neuronales légères, parallèle à la tendance des VLA (Vision-Language-Action models) qui cherchent à généraliser plutôt qu'à optimiser. Des travaux antérieurs ont exploré des approches similaires sur des robots à plus grand nombre de DOF, mais l'originalité ici réside dans l'analyse comparative systématique des architectures et la quantification rigoureuse du compromis latence/précision. Ce preprint n'est pas encore évalué par les pairs ; les prochaines étapes naturelles incluent la validation sur manipulateurs réels à 6 ou 7 DOF et le test sous charges variables.

RecherchePaper

1 source