Aller au contenu principal
MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée
RecherchearXiv cs.RO6sem

MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs du MMlab (Hong Kong) ont publié les spécifications complètes de MM-Hand, une main robotique à actionnement tendineux déporté dotée de 21 degrés de liberté (DOF). L'architecture centrale repose sur la délocalisation des moteurs vers la base du robot ou un hub moteur externe, les tendons transitant par des gaines flexibles jusqu'aux doigts. La main intègre des doigts à retour par ressort, des structures palmaire et digitale modulaires imprimées en 3D, des connecteurs tendineux à remplacement rapide, ainsi qu'un système de captation multimodale comprenant des encodeurs articulaires, des capteurs tactiles, un retour d'effort côté moteur, et une caméra stéréo embarquée dans la paume. Les expériences publiées rapportent une force de 25 N en bout de doigt via une transmission tendon-gaine d'un mètre, et les essais en boucle fermée ont été conduits aussi bien bras statique que bras en mouvement. L'ensemble des designs matériels et logiciels est publié en open source.

Ce travail s'attaque à un verrou classique de la manipulation dextère à haute densité de DOF : l'encombrement thermique et massique des actionneurs embarqués dans la main. En déportant les moteurs, MM-Hand libère le volume intra-main pour des capteurs et des mécanismes supplémentaires, ce qui change concrètement l'équation pour les laboratoires de recherche en manipulation. La combinaison vision stéréo palmaire et toucher tactile dans un seul effecteur ouvre la voie à des politiques d'apprentissage multimodal (VLA, diffusion policies) sans avoir à multiplier les capteurs externes. La publication open source de la mécanique et du firmware est un signal fort : les auteurs misent sur la réplication communautaire pour valider le passage à l'échelle, ce que les démonstrations en laboratoire seul ne peuvent pas prouver.

MM-Hand s'inscrit dans un effort plus large d'industrialisation de la main robotique dextère, un segment où l'on retrouve Shadow Robotics (UK, 24-DOF, câbles), Inspire Robots (Chine, utilisée sur Unitree H1 et G1) et Wonik Robotics (Allegro Hand, 16-DOF, courroies). La différenciation revendiquée de MM-Hand est sa maintenabilité modulaire et son coût de reproduction accessible via impression 3D. Le MMlab n'a pas annoncé de partenariat industriel ni de feuille de route de commercialisation : il s'agit pour l'instant d'une plateforme de recherche publiée, pas d'un produit shipé.

Impact France/UE

Les laboratoires européens de recherche en manipulation dextère peuvent répliquer MM-Hand grâce à la publication open source complète (mécanique + firmware), mais aucun partenariat ni déploiement européen n'est annoncé par le MMlab.

Dans nos dossiers

À lire aussi

Modélisation dynamique hybride d'un bras robotique flexible à 2 degrés de liberté
1arXiv cs.RO 

Modélisation dynamique hybride d'un bras robotique flexible à 2 degrés de liberté

Une équipe de chercheurs a soumis sur arXiv (référence 2606.02969) une étude comparant trois méthodes de modélisation dynamique pour un bras robotique à 2 degrés de liberté (2-DoF) à liaisons flexibles. Deux approches dites "physics-informed" combinent des formulations de dynamique corps-rigide (RBD) avec un modèle de mélange gaussien (GMM) pour capturer les erreurs résiduelles et la flexibilité mécanique des segments. Une troisième approche, purement data-driven, sert de référence via régression cinématique. Sur un jeu de données open-source, les prédictions de couple ont été estimées par régression Ridge sur des variables cinématiques ; le modèle physique de référence a été construit à partir des spécifications constructeur publiées, puis une version alternative a estimé les mêmes paramètres directement par moindres carrés ordinaires (OLS). Résultat central : les paramètres issus des fiches techniques affichent la moins bonne précision, tandis que les estimateurs Ridge et OLS s'alignent significativement mieux avec les couples mesurés. Ce résultat fragilise une hypothèse répandue en robotique industrielle : que les modèles analytiques construits à partir des spécifications constructeur constituent une base fiable pour la commande ou la simulation. Pour les bras à liaisons flexibles, les déformations mécaniques sous charge introduisent des dynamiques non modélisées que les formulations corps-rigide classiques ignorent, creusant un écart mesurable entre modèle et réalité. L'étude démontre que la régularisation et l'identification directe par données comblent ces lacunes plus efficacement que les paramètres physiques bruts. Pour un intégrateur ou un ingénieur concevant des contrôleurs pour robots légers, cobots ou bras à câbles, cela implique concrètement de recalibrer les paramètres dynamiques sur des mesures in situ plutôt que de faire confiance aux valeurs datasheet. Le travail appuie également le développement des méthodes semi-paramétriques de "residual learning", qui associent un modèle physique imparfait à un correcteur appris, évitant ainsi le choix binaire entre approche analytique et approche purement données. La modélisation des robots à liaisons flexibles est un problème de recherche actif depuis plusieurs décennies, devenu particulièrement stratégique avec la montée des cobots et des manipulateurs légers dont les segments se déforment sous charge. Ce travail s'inscrit dans un mouvement plus large vers les réseaux physics-informed (PINN) et les méthodes hybrides physique-apprentissage. En Europe, plusieurs équipes travaillent sur des architectures similaires pour robots à câbles et manipulateurs souples. L'un des atouts de cette étude est d'utiliser un jeu de données ouvert, ce qui en fait une référence utilisable pour benchmarker de nouvelles approches. La suite logique est l'intégration de ces modèles hybrides dans des boucles de commande temps réel et leur extension à des architectures à plus de degrés de liberté.

UELes équipes européennes développant des cobots et manipulateurs légers peuvent appliquer directement la recommandation de recalibrer les paramètres dynamiques par identification in situ plutôt que de se fier aux fiches constructeur.

RecherchePaper
1 source
S-Cheetah : un robot quadrupède innovant avec une colonne vertébrale active à 3 degrés de liberté pour une locomotion agile
2arXiv cs.RO 

S-Cheetah : un robot quadrupède innovant avec une colonne vertébrale active à 3 degrés de liberté pour une locomotion agile

Des chercheurs du laboratoire Himmy Robotics ont présenté S-Cheetah, un robot quadrupède doté d'une colonne vertébrale active à 3 degrés de liberté (DOF) reproduisant la flexion sagittale, la flexion latérale et la rotation axiale des félins. Publié le 28 mai 2026 sur arXiv (preprint 2605.27909), le système atteint 6,9 m/s en galop rotatif G2 et un taux de rotation sur place de 7,2 rad/s. Pour exploiter pleinement cette architecture mécanique, l'équipe a développé un framework d'apprentissage par renforcement (RL) combinant un curriculum d'accélération progressive et des fonctions de récompense spécifiques : récompense de galop, d'ondulation spinale et de direction spinale. Le robot exhibe également une capacité émergente de redressement aérien inspirée des félins, atterrissant sur ses quatre pattes depuis n'importe quelle orientation en chute libre. La majorité des robots quadrupèdes intègrent aujourd'hui des colonnes actives à 1 ou 2 DOF pour limiter la complexité de contrôle, sacrifiant ainsi la richesse de mouvement observée chez les animaux biologiques. S-Cheetah tente de combler cet écart : un spine tri-axial complet avait jusqu'ici été évité car il complique radicalement la planification du mouvement. Le principal apport technique réside dans le fait que le framework RL force l'engagement actif de la colonne plutôt que de la laisser passive. La capacité de redressement aérien, non programmée explicitement mais émergente, renforce la thèse que des curricula de récompense bien construits peuvent capturer des dynamiques corporelles complexes et réduire le sim-to-real gap pour des architectures mécaniques atypiques. S-Cheetah s'inscrit dans la lignée du MIT Cheetah, d'ANYmal (ETH Zurich / ANYbotics) et des plateformes Unitree (B2, Go2), dont la plupart utilisent un tronc rigide ou une articulation spinale à 1 DOF. Ce travail reste un preprint non encore évalué par les pairs, sans pilote industriel ni commercialisation annoncés. Les performances proviennent de tests en laboratoire et les vidéos sélectionnées ne permettent pas encore d'évaluer la robustesse en conditions réelles non structurées. Les prochaines étapes, selon la page projet himmy-robotics.github.io/scheetah, devraient porter sur des tâches locomotrices plus complexes et des évaluations en environnement extérieur.

RecherchePaper
1 source
Clonage comportemental de la commande prédictive pour manipulateurs robotiques à 3 degrés de liberté
3arXiv cs.RO 

Clonage comportemental de la commande prédictive pour manipulateurs robotiques à 3 degrés de liberté

Une équipe de chercheurs présente dans un preprint arXiv (2606.00383, soumis début juin 2026) une étude empirique sur l'application du Behavior Cloning pour approximer les politiques de commande prédictive par modèle (MPC) sur un manipulateur robotique à 3 degrés de liberté (DOF). Le principe : entraîner un réseau de neurones à imiter le comportement d'un contrôleur MPC classique, couplé à de la cinématique inverse, afin de produire une politique de substitution nettement moins coûteuse en calcul. Plusieurs architectures ont été évaluées, des régresseurs classiques aux réseaux profonds (Deep MLP) en passant par des architectures récurrentes (RNN), selon des protocoles d'évaluation en ligne et hors ligne. Le meilleur résultat atteint une réduction de latence d'inférence d'un facteur 3 par rapport au MPC original, avec un taux de succès de 84,98 % sous tolérances relâchées. Point notable : les architectures statiques (MLP) surpassent les variantes temporelles (RNN), ce qui suggère que l'observation instantanée de l'état est suffisante pour cette tâche. Ce résultat est significatif pour les systèmes embarqués temps réel, où le MPC est souvent jugé trop gourmand en ressources pour tourner en boucle fermée sur du matériel contraint. La distillation de politique MPC via l'imitation ouvre la voie à des contrôleurs légers déployables sur des microcontrôleurs ou des SoC industriels sans sacrifier l'essentiel de la qualité de trajectoire. Cependant, la réserve éditoriale s'impose : les 84,98 % de succès sont mesurés sous tolérances relâchées. Sous tolérances strictes, les auteurs observent un écart de précision résiduel, notamment sur l'erreur en régime permanent, ce qui limite pour l'instant l'applicabilité à des tâches d'assemblage de haute précision. Le Behavior Cloning appliqué au contrôle de bras robotiques s'inscrit dans un courant plus large de distillation de contrôleurs optimaux vers des politiques neuronales légères, parallèle à la tendance des VLA (Vision-Language-Action models) qui cherchent à généraliser plutôt qu'à optimiser. Des travaux antérieurs ont exploré des approches similaires sur des robots à plus grand nombre de DOF, mais l'originalité ici réside dans l'analyse comparative systématique des architectures et la quantification rigoureuse du compromis latence/précision. Ce preprint n'est pas encore évalué par les pairs ; les prochaines étapes naturelles incluent la validation sur manipulateurs réels à 6 ou 7 DOF et le test sous charges variables.

RecherchePaper
1 source
Modèles du monde pour la manipulation robotique : une synthèse de la littérature
4arXiv cs.RO 

Modèles du monde pour la manipulation robotique : une synthèse de la littérature

Une revue de littérature publiée sur arXiv (2606.00113) cartographie l'état de l'art des modèles du monde (world models) appliqués à la manipulation robotique. Les auteurs recensent cinq familles de représentations prédictives : modèles de dynamique latente, générateurs vidéo conditionnés par l'action, prédicteurs de scène 3D et 4D, simulateurs à contraintes physiques, et modules prédictifs embarqués dans les systèmes vision-langage-action (VLA). La revue couvre 34 jeux de données de manipulation et propose une taxonomie fonctionnelle distinguant les modèles intégrant prédiction et action de ceux servant de planificateurs explicites. Trois axes structurent l'analyse : quelle représentation future est prédite, comment la prédiction se connecte à l'action, et à quel moment du pipeline d'apprentissage robotique elle intervient. Cette synthèse répond à un besoin concret : le terme "world model" recouvre des réalités très hétérogènes, ce qui brouille les comparaisons et ralentit les transferts technologiques entre laboratoires. En posant une définition opérationnelle stricte (un world model est un système prédictif conditionné par l'action, distinct des modules de perception, des politiques ou des fonctions de valeur), les auteurs établissent un cadre commun dont manquait le secteur. La revue confirme que ces systèmes évoluent d'outils de simulation spécialisés vers une infrastructure générique pour l'apprentissage robotique : génération d'expériences synthétiques, filtrage de candidats, vérification de résultats. Ce glissement architectural touche directement les pipelines de pré-entraînement, de post-entraînement et d'adaptation à l'inférence, trois phases critiques pour quiconque industrialise un robot manipulateur. Le domaine a accéléré avec l'essor des VLA comme Pi-0 (Physical Intelligence) et GR00T N2 (NVIDIA), et l'adoption des architectures Transformer en robotique, mais sans convergence méthodologique. La fragmentation reflète une course entre grands labs (Google DeepMind, MIT, Stanford, Berkeley) et startups qui ne partagent ni benchmarks ni protocoles d'évaluation communs. Les défis ouverts identifiés par les auteurs, notamment la modélisation des contacts, le contrôle des hallucinations, l'alignement action-prédiction et le benchmarking en boucle fermée, tracent un agenda de recherche pour les prochaines années. Pour les équipes travaillant sur la manipulation industrielle ou les bras collaboratifs, cette revue constitue une feuille de route pour choisir quelle classe de world model intégrer selon le cas d'usage : data augmentation, planification prédictive ou vérification de trajectoires.

UELes équipes européennes (INRIA, CEA-List, labos collaboratifs) travaillant sur la manipulation robotique peuvent s'appuyer sur cette taxonomie pour structurer leurs choix d'architecture world model, mais aucun acteur ni financement européen n'est impliqué directement.

RecherchePaper
1 source