Aller au contenu principal
Apprentissage du contrôle multimodal du corps entier pour robots humanoïdes réels
HumanoïdesarXiv cs.RO10h

Apprentissage du contrôle multimodal du corps entier pour robots humanoïdes réels

1 source couvre ce sujet·Source originale ↗·

Des chercheurs en robotique ont publié sur arXiv une avancée notable dans le contrôle des robots humanoïdes, présentant le Masked Humanoid Controller (MHC), un système d'apprentissage automatique capable de piloter l'ensemble du corps d'un robot à partir d'une interface unifiée. Concrètement, le MHC reçoit des commandes sous forme de trajectoires partiellement spécifiées, seules certaines parties du corps sont ciblées à la fois, et les exécute en maintenant l'équilibre général de la machine. Le système a été validé sur le robot humanoïde réel Digit V3 du fabricant Agility Robotics, démontrant que les comportements appris en simulation se transfèrent effectivement au monde physique.

Ce qui distingue le MHC, c'est sa capacité à traiter des entrées radicalement différentes avec un seul contrôleur : séquences de pas planifiées par un algorithme d'optimisation, clips de capture de mouvement humain, vidéos retransposées sur le robot, ou signaux de téléopération en temps réel via joystick. Jusqu'ici, chacun de ces modes nécessitait généralement un pipeline dédié. Cette unification simplifie considérablement l'architecture des systèmes robotiques et ouvre la voie à des robots capables de recevoir des instructions hybrides, par exemple suivre une trajectoire planifiée tout en imitant simultanément des gestes captés sur une vidéo.

Le problème du contrôle corps entier est l'un des verrous majeurs de la robotique humanoïde commerciale, alors que des acteurs comme Boston Dynamics, Figure AI ou Tesla Optimus investissent massivement dans ce secteur. La tendance actuelle consiste à entraîner des contrôleurs en simulation, moins coûteux et plus sûr, puis à les transférer sur du matériel réel, une approche que le MHC illustre avec le Digit V3. L'utilisation d'un curriculum d'entraînement couvrant l'ensemble des modalités d'entrée est la clé qui permet cette polyvalence sans sacrifier la robustesse. Les prochaines étapes logiques concerneront l'intégration de modèles de langage comme interface de haut niveau, permettant à terme de donner des instructions verbales à un humanoïde qui les traduirait en commandes motrices complexes.

À lire aussi

Vidéo : Ce robot humilie les meilleurs joueurs de ping-pong au monde
1Le Big Data 

Vidéo : Ce robot humilie les meilleurs joueurs de ping-pong au monde

Sony AI a dévoilé mercredi dans la revue scientifique Nature les résultats d'Ace, un robot de tennis de table développé à Zurich. Sur cinq matchs disputés en règles officielles contre des joueurs d'élite, Ace en a remporté trois. Face à des professionnels confirmés, le bilan est plus nuancé : deux défaites et une seule manche gagnée sur sept rencontres. Le système repose sur un bras articulé à huit axes monté sur une base mobile, équipé de caméras multi-angles qui analysent position et rotation de la balle en temps réel. En ciblant le logo imprimé sur la balle, Ace estime l'effet en quelques millisecondes. L'entraînement a nécessité environ 3 000 heures de simulation, et certains gestes, notamment le service, ont été modélisés directement à partir de joueurs expérimentés. Peter Dürr, responsable du projet chez Sony AI, indique que le robot a depuis progressé : « Nous avons affronté des adversaires plus forts et nous les avons battus. » Le tennis de table est depuis longtemps considéré comme l'un des défis les plus ardus pour la robotique : la vitesse des échanges, la diversité des effets et la précision millimétrée requise en font un banc d'essai exigeant pour les systèmes autonomes. Ace a démontré une maîtrise solide de ces contraintes, gérant des situations complexes comme des balles frôlant le filet, et réalisant un coup rétro rapide qu'un ancien joueur olympique, Kinjiro Nakamura, jugeait jusqu'alors impossible à produire mécaniquement. Ce dernier estime désormais que les humains pourraient s'inspirer de cette technique. Le robot bénéficie par ailleurs d'un avantage psychologique non négligeable : sans regard ni langage corporel, ses intentions sont illisibles pour l'adversaire, ce qui perturbe les stratégies habituelles de lecture du jeu. Cette percée s'inscrit dans une compétition mondiale accélérée autour de la robotique généraliste à haute réactivité, où Sony AI se positionne comme un acteur sérieux aux côtés de Google DeepMind, Boston Dynamics ou Figure AI. Jusqu'ici, les tentatives de robots pongistes restaient cantonnées à des démonstrations contrôlées, loin des conditions de match réel. Publier dans Nature avec des résultats contre de vrais compétiteurs marque un saut qualitatif. Les limites actuelles d'Ace, difficultés sur les balles lentes et peu liftées, indiquent les axes de travail restants, mais la trajectoire est claire : chaque version repousse davantage le niveau humain de référence, et les chercheurs laissent entendre que la parité avec les meilleurs joueurs mondiaux n'est plus une question de principe, mais de temps.

HumanoïdesOpinion
1 source
Vidéo : SamuRoid, le robot humanoïde chinois compact aux interactions plus intelligentes
2Interesting Engineering 

Vidéo : SamuRoid, le robot humanoïde chinois compact aux interactions plus intelligentes

SamuRoid, un robot humanoïde compact développé par la société chinoise XiaoR Geek Technology basée à Shenzhen, vient d'être présenté comme une nouvelle plateforme d'IA embarquée accessible aux chercheurs et développeurs. Mesurant 390 mm de hauteur pour 2,3 kg, il embarque 22 servomoteurs haute-couple de la série XRS couvrant l'intégralité du corps, une caméra 1080p grand angle sur une nacelle 2 axes, un microphone USB intégré, ainsi qu'une connectivité Wi-Fi 5 double bande et Bluetooth 5.0. Son cerveau est un Raspberry Pi 4 Model B disponible en 4 ou 8 Go de RAM. La batterie 12V 3000 mAh lui offre environ une heure d'autonomie. La version Professional Edition est proposée à environ 1 565 dollars, tandis que des éditions Developer et Flagship plus complètes sont actuellement en rupture de stock. Ce qui distingue SamuRoid de ses prédécesseurs, c'est son niveau d'intégration logicielle et ses capacités multimodales. Le robot fonctionne sous ROS (Robot Operating System), avec un code source ouvert compatible C++ et Python, et intègre OpenCV pour la reconnaissance faciale, le suivi de couleurs et la détection de QR codes. Surtout, il se connecte à des grands modèles de langage comme DeepSeek et Doubao, ce qui lui permet de comprendre des instructions en langage naturel plutôt que des commandes rigides. Si un utilisateur dit qu'il est fatigué et veut s'amuser, le système interprète l'intention et déclenche une action appropriée, comme une chorégraphie, tout en fournissant un retour vocal. Ce saut qualitatif positionne SamuRoid comme un outil de recherche crédible pour explorer l'interaction homme-machine de nouvelle génération, à un prix bien en dessous des plateformes industrielles. L'essor de robots humanoïdes compacts et ouverts reflète une tendance de fond dans l'industrie robotique mondiale : rendre l'IA incarnée accessible hors des grands laboratoires. Jusqu'ici, ce segment était dominé par des plateformes coûteuses ou des jouets aux capacités limitées. XiaoR Geek tente de combler cet écart en proposant une architecture ouverte compatible avec les workflows ROS standard, adoptés par la grande majorité des chercheurs en robotique. La Chine multiplie ces initiatives, portée par un écosystème de fabrication performant et des modèles de langage locaux comme DeepSeek qui rivalisent désormais avec les offres occidentales. SamuRoid arrive dans un contexte où plusieurs acteurs, d'Agility Robotics à Figure AI en passant par Boston Dynamics, cherchent à démocratiser l'humanoïde. La question ouverte reste celle de la durée d'autonomie, une heure restant un frein réel pour des usages continus, et de la robustesse en dehors des environnements contrôlés.

HumanoïdesActu
1 source
Le robot IA de Sony bat des joueurs pendant qu'un robot humanoïde remporte une course à Pékin
3AI News 

Le robot IA de Sony bat des joueurs pendant qu'un robot humanoïde remporte une course à Pékin

Un robot de tennis de table développé par Sony AI, baptisé Ace, a remporté des matchs contre des joueurs humains de haut niveau dans des conditions de compétition officielles, arbitrées selon les règles de la Fédération internationale de tennis de table. En avril 2025, Ace a gagné trois manches sur cinq face à des joueurs de niveau élite, avant d'enchaîner de nouvelles victoires contre des professionnels en décembre 2025 et début 2026. Le système repose sur neuf caméras synchronisées, trois systèmes de vision et huit articulations contrôlant la raquette, le tout capable de traiter le mouvement d'une balle à une vitesse que l'oeil humain ne peut résoudre. Contrairement aux robots de ping-pong existants depuis les années 1980, Ace n'a pas été entraîné par imitation de joueurs humains mais par auto-apprentissage en simulation, ce qui lui a permis de développer des stratégies propres, moins prévisibles pour ses adversaires. L'étude décrivant le système a été publiée dans la revue Nature. Cette performance marque une étape significative dans ce que l'industrie appelle la "physical AI", l'application de l'intelligence artificielle à des machines opérant dans des environnements réels et dynamiques. Le tennis de table représente un défi technique particulièrement difficile : la vitesse de la balle, la variabilité des effets et la contrainte de temps extrême exigent une perception et une coordination quasi instantanées. Peter Dürr, directeur de Sony AI Zurich et responsable du projet, souligne que contrairement aux jeux vidéo ou aux échecs, les sports physiques en temps réel restaient jusqu'ici hors de portée de l'IA. La joueuse professionnelle Mayuka Taira, battue par Ace, a noté que l'absence de signaux émotionnels du robot le rendait particulièrement difficile à lire : impossible de deviner ses points faibles ou ses préférences de jeu. L'équipe de Sony AI estime que les techniques de perception et de contrôle développées pour Ace pourront être transposées à la robotique industrielle et aux services. Dans un registre différent mais tout aussi révélateur de l'essor de la robotique physique, le premier semi-marathon de robots humanoïdes s'est tenu le même mois à Pékin, dans le district d'E-Town. L'événement a réuni plus d'une centaine de robots et quelque 12 000 coureurs humains sur des parcours séparés de 21 kilomètres. Le robot Lightning, développé par Honor, a franchi la ligne d'arrivée en 50 minutes et 26 secondes, établissant le meilleur temps de la compétition. Ces deux événements, le robot pongiste de Sony et le marathon pékinois, illustrent une même dynamique : après des années de progrès dans les environnements numériques contrôlés, l'IA s'attaque désormais au monde physique, avec des résultats qui commencent à rivaliser sérieusement avec les capacités humaines dans des disciplines concrètes et mesurables.

UELes techniques de perception et de contrôle développées par Sony AI Zurich pourraient influencer la robotique industrielle européenne à terme, mais aucun impact direct sur la France ou l'UE n'est identifiable à ce stade.

HumanoïdesOpinion
1 source
Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique
4Interesting Engineering 

Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique

La société de construction britannique Tilbury Douglas est devenue la première grande entreprise du secteur au Royaume-Uni à déployer un robot humanoïde sur un chantier réel. Baptisé Douglas, le robot de 30 kg est fabriqué par Unitree, l'un des leaders mondiaux du marché des robots humanoïdes. Il a déjà prouvé son utilité lors d'un essai de dix semaines sur site actif. Sa mission n'est pas de poser des briques ni de couler du béton, mais de prendre en charge les tâches administratives et de collecte de données qui mobilisent quotidiennement les équipes. Équipé de capteurs LiDAR et de caméras 360 degrés, Douglas parcourt le chantier de façon autonome, photographie les avancées de la construction depuis des coordonnées identiques chaque jour, effectue des scans laser pour générer des nuages de points en trois dimensions, et alimente directement les flux de travail liés à la sécurité. Résultat : environ 40 heures de travail administratif économisées chaque mois, soit une semaine complète rendue aux équipes terrain. Cet apport concret change la donne pour les chefs de chantier, qui passaient jusqu'ici une partie de leur journée à arpenter les structures en acier et les pièces inachevées pour documenter l'avancement des travaux. En confiant cette routine à la machine, Tilbury Douglas libère ses professionnels pour des tâches à plus forte valeur ajoutée : coordination technique, résolution de problèmes complexes, management des équipes. La précision du robot dépasse également celle d'un humain sur certains points : en capturant les données depuis exactement les mêmes positions chaque jour, il permet aux logiciels d'IA de détecter automatiquement les déviations et les défauts de construction que l'oeil humain pourrait rater. À 15 000 livres sterling, son coût reste relativement accessible pour une entreprise du secteur. Le timing de ce déploiement n'est pas anodin. Le secteur de la construction britannique traverse une pénurie de compétences structurelle, peinnant à recruter la prochaine génération d'ingénieurs et de chefs de projet. C'est dans ce contexte que Tilbury Douglas, via son directeur technique Mark Buckle, présente Douglas non pas comme un substitut aux travailleurs, mais comme un outil pour les renforcer en automatisant les tâches répétitives. Pour l'heure, le robot est maintenu à distance des bords de chantier pour éviter les chutes, et sera prochainement équipé de marquages haute visibilité et d'une balise d'avertissement pour évoluer en sécurité à proximité d'engins lourds dès les phases de fondation. Cette expérience illustre une tendance de fond : l'IA et la robotique bouleversent les métiers manuels tout autant que les fonctions de bureau, redessinant en profondeur l'organisation du travail dans les industries physiques.

UELe secteur du BTP européen, confronté aux mêmes pénuries structurelles de main-d'œuvre qualifiée qu'au Royaume-Uni, pourrait rapidement s'inspirer de ce déploiement, les robots Unitree étant déjà commercialisés en Europe.

HumanoïdesActu
1 source