Aller au contenu principal

Dossier Unitree — page 4

473 articles · page 4 sur 10

Unitree, l'humanoïde et quadrupède chinois low-cost : G1, H1, R1, prix grand public sur AliExpress, démonstrations agressives en vidéo et impact sur les concurrents premium.

ReactiveBFM : planification de mouvement réactive en boucle fermée pour le contrôle global des humanoïdes
151arXiv cs.RO RechercheOpinion

ReactiveBFM : planification de mouvement réactive en boucle fermée pour le contrôle global des humanoïdes

Des chercheurs ont publié le 30 juin 2026 sur arXiv (identifiant 2606.30362) les travaux ReactiveBFM, un framework de planification-contrôle en boucle fermée temps réel pour humanoïdes, validé sur le robot Unitree G1. L'approche atteint un taux de succès de 93,1 % lors de benchmarks sim-to-sim soumis à des perturbations sévères, surpassant de 28,6 points les baselines en boucle ouverte classiques. Le système permet notamment la poursuite de cibles mobiles en zero-shot, c'est-à-dire sans avoir été entraîné explicitement sur cette tâche, en mobilisant une coordination corps entier fluide et une replanification à la volée. Le verrou technique adressé est le problème dit d'exposition bias : quand un modèle génératif de planification de mouvement est naïvement chaîné avec un contrôleur d'exécution, les écarts de suivi s'accumulent jusqu'à provoquer des effondrements comportementaux. ReactiveBFM répond à cela via un curriculum d'échantillonnage par préfixe planifié (scheduled prefix sampling), qui force le planificateur à apprendre des comportements de récupération d'erreur à partir d'états physiques imparfaits plutôt que de trajectoires de référence idéales. Un second mécanisme d'asynchronisme découple la replanification autorégressive, lente, du tracking haute fréquence, tandis qu'un chunking de trajectoire assure la cohérence spatio-temporelle sans jitter physique. Pour les intégrateurs industriels et les équipes de recherche en contrôle humanoïde, cela valide une piste concrète pour rendre les Behavior Foundation Models (BFMs) exploitables hors conditions laboratoire. Les BFMs sont une classe émergente de modèles pré-entraînés qui fournissent des priors de contrôle pour humanoïdes, analogues aux LLMs pour le texte. Jusqu'ici, leur limitation majeure était l'exécution figée de mouvements pré-définis, sans adaptation à l'environnement. Le Unitree G1, humanoïde chinois à 16 000 dollars commercialisé depuis 2024, s'est imposé comme banc de test standard dans la recherche académique. Les concurrents directs sur le plan scientifique incluent les travaux autour de Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) et les architectures VLA embarquées chez Figure et Agility Robotics. Ce papier reste à ce stade un preprint non évalué par les pairs : les résultats sim-to-sim sont prometteurs mais aucun déploiement industriel ni transfert sim-to-real robuste n'est encore démontré.

UELes techniques ReactiveBFM (curriculum de préfixe planifié, réplanification asynchrone, chunking de trajectoire) sont directement exploitables par les équipes R&D européennes travaillant sur les Behavior Foundation Models pour humanoïdes, mais aucun acteur français ou européen n'est impliqué dans ces travaux.

1 source
RetrDex : récupération efficace d'objets dans des environnements encombrés avec une main dextérique
152arXiv cs.RO 

RetrDex : récupération efficace d'objets dans des environnements encombrés avec une main dextérique

RetrDex est un framework de recherche publié sur arXiv (référence 2502.18423, troisième révision) dont l'objectif est d'apprendre à un système bras-main dextre à récupérer des objets enfouis sous un empilement d'autres objets. L'approche repose sur du reinforcement learning (RL) parallèle à grande échelle conduit en simulation, couplé à une représentation spatiale qui encode les patterns d'occlusion ainsi que les relations géométriques entre la cible, la main multi-doigts et les objets alentour. La politique résultante développe un répertoire de gestes, poussée, agitation et piquage (poking), pour dégager activement les obstacles avant ou pendant la saisie. Évalué sur 16 objets ménagers courants dans des configurations variées, le système affiche de bonnes performances sur des cibles vues en entraînement comme sur des cibles inédites. Un transfert zero-shot vers un robot réel multi-doigts est revendiqué, sans fine-tuning supplémentaire. La récupération d'objets en scène encombrée est un problème ouvert en manipulation robotique : les approches classiques décomposent la tâche en étapes séquentielles indépendantes (retirer les objets qui gênent un par un, puis saisir), ce qui génère des séquences longues et peu robustes aux variations. RetrDex intègre ces interactions physiques directement dans la politique de récupération, réduisant potentiellement le nombre de mouvements nécessaires. La revendication la plus notable reste le zero-shot sim-to-real sur une main dextre : ce type de transfert est notoirement difficile à cause de la complexité des contacts multi-doigts et du gap dynamique entre simulation et réalité physique. Si les résultats tiennent à l'examen approfondi, cela renforce la thèse que le RL massivement parallèle en simulation peut généraliser sur du matériel réel pour des tâches de manipulation en espace contraint, sans données réelles supplémentaires. Le papier s'inscrit dans une tendance forte : utiliser le RL en simulation à très grande échelle pour entraîner des politiques de manipulation dextre, une direction explorée par des équipes de Berkeley (DexGraspNet), Stanford et, côté industriel, par des acteurs comme Unitree ou Agility Robotics sur leurs propres mains multi-doigts. Les méthodes concurrentes récentes, graphes de relations de support ou planification séquentielle avec contraintes géométriques, adoptent des stratégies que RetrDex cherche à dépasser en termes d'efficacité. Soumis initialement en février 2025 et révisé jusqu'en 2026, le travail n'annonce pas de code open-source dans son résumé, ce qui limite les possibilités de réplication à court terme. Les suites naturelles seraient des tests sur objets déformables, une extension à des charges utiles plus importantes et une intégration dans une chaîne logistique ou un poste d'assemblage industriel réel.

RecherchePaper
1 source
KYON : quadrupède semi-modulaire roues-pattes aux capacités bimanuelles agiles
153arXiv cs.RO 

KYON : quadrupède semi-modulaire roues-pattes aux capacités bimanuelles agiles

KYON est un robot quadrupède hybride roue-jambes, doté d'un torse bimanel, présenté dans un preprint arXiv (2606.30243) publié fin juin 2026 par une équipe dont l'affiliation institutionnelle n'est pas précisée dans l'abstract. La plateforme adopte une architecture semi-modulaire : les membres inférieurs sont reconfigurables, permettant de basculer entre locomotion sur roues et locomotion sur pattes selon le terrain. Plutôt que de distribuer les actionneurs le long des membres, KYON les concentre dans le châssis central et transmet le mouvement via des mécanismes de transmission, ce qui réduit l'inertie distale et améliore l'agilité dynamique. Le système de contrôle combine un cadre de contrôle du corps entier (whole-body control) avec une politique d'apprentissage par renforcement (RL), traitant séparément mais de façon coordonnée les tâches de locomotion et de manipulation. Les résultats expérimentaux rapportés valident la capacité du robot à opérer en locomotion dynamique et en manipulation bimane dans des environnements non structurés -- aucun chiffre précis de charge utile, de degrés de liberté ou de temps de cycle n'est communiqué dans l'abstract. L'intérêt de KYON pour les intégrateurs industriels et les décideurs B2B tient à la combinaison rare d'une base mobile à double mode (roue/patte) et d'une capacité de manipulation à deux bras sur un même châssis compact. La réduction de l'inertie distale via la centralisation des actionneurs est un choix de conception déjà validé sur des plateformes comme l'ANYmal de ANYbotics ou le MIT Cheetah, et son application à un système bimane à mobilité hybride constitue un apport méthodologique tangible. L'usage du RL pour absorber les perturbations dynamiques sans recalibration manuelle est cohérent avec les avancées récentes en sim-to-real, bien que les conditions exactes de test et les métriques de robustesse ne soient pas détaillées, ce qui limite l'évaluation externe à ce stade. Le marché des quadrupèdes mobiles est aujourd'hui dominé par Boston Dynamics (Spot), ANYbotics (ANYmal C/D), Unitree (B2, Go2) et, en France, des acteurs comme Wandercraft sur le segment bipède. La niche hybride roue-patte est occupée par peu de plateformes commerciales matures, ce qui positionne KYON comme un candidat de recherche dans un espace encore peu peuplé. Publié en preprint sans validation par les pairs, ce travail reste au stade de prototype de laboratoire : aucun partenaire industriel, aucun déploiement ni calendrier de commercialisation ne sont mentionnés. Les prochaines étapes naturelles seraient une publication en conférence (ICRA, IROS, RSS) et des tests en conditions réelles d'entrepôt ou de logistique.

RecherchePaper
1 source
Zhipingfang valorisé à 2,8 milliards : première licorne d'IA incarnée de la Greater Bay Area
154Pandaily 

Zhipingfang valorisé à 2,8 milliards : première licorne d'IA incarnée de la Greater Bay Area

Zhipingfang, startup d'IA incarnée basée à Shenzhen, a bouclé une levée de fonds d'environ 5 milliards de yuans (700 millions de dollars), portant sa valorisation à plus de 20 milliards de yuans (2,8 milliards de dollars). L'opération en fait le premier licorne de l'IA incarnée de la Greater Bay Area à franchir ce seuil. Le tour réunit un spectre inhabituellement large d'investisseurs : fonds publics nationaux (National SME Development Fund, China Cultural Industry System Fund), fonds provinciaux dédiés à l'IA, compagnies d'assurance et maisons de titres, et investisseurs industriels dont CP Group (China Biologic Products), Pharmaron, Moutai Group et China Merchants Capital. La société commercialise une architecture baptisée NeuroVLA, présentée par son fondateur et CEO, Guo Yandong, au Summer Davos Forum de juin 2026, où le Premier ministre Li Qiang a expressément cité le Shenzhen Robot Valley comme vitrine de l'écosystème d'innovation chinois. NeuroVLA organise le traitement en trois couches hiérarchiques calquées sur le système nerveux humain : un module cortical pour le raisonnement sémantique de haut niveau, un module cérébelleux pour le contrôle moteur coordonné, et un module spinal pulsé pour les boucles de rétroaction à ultra-faible latence. L'intérêt industriel de cette architecture réside dans l'efficacité computationnelle, problème structurel des systèmes robotiques actuels. Les architectures VLA (Vision-Language-Action) conventionnelles mobilisent l'intégralité de la puissance de calcul quelle que soit la complexité de la tâche, ce qui se traduit par des coûts d'inférence prohibitifs et des latences incompatibles avec le contrôle temps réel. NeuroVLA prétend résoudre cela par un routage événementiel : les boucles rapides (réflexes, stabilisation) sont traitées en couches basses, libérant le "cortex" pour le raisonnement symbolique. Le modèle biologique invoqué est le cerveau humain, 86 milliards de neurones fonctionnant à environ 20 watts, soit une densité de calcul que les GPU actuels n'approchent pas à consommation équivalente. Il faut cependant noter que les performances opérationnelles de NeuroVLA en conditions industrielles réelles ne sont pas documentées publiquement au-delà des communications de la société, et que l'affirmation de "première mondiale" reste invérifiable en l'absence de benchmark comparatif indépendant. La trajectoire financière de Zhipingfang est en elle-même un signal de marché : 12 tours de financement bouclés en un an, et une valorisation doublée de 10 à 20 milliards de yuans en quatre mois seulement, ce qui en fait, selon ses propres déclarations, la startup d'IA incarnée la plus rapide à lever à ce rythme et à cette échelle. L'entreprise est implantée au Shenzhen Robot Valley, pôle qui concentre également des acteurs comme Unitree, et s'inscrit dans une dynamique nationale où Pékin oriente massivement les fonds souverains vers l'IA incarnée pour concurrencer Figure AI (valorisé à 2,6 milliards de dollars fin 2024), Physical Intelligence et 1X côté américain, et Agility Robotics côté déploiements industriels. Aucune timeline de déploiement commercial ni volume de commandes n'ont été communiqués ; la levée reste pour l'instant une étape de financement de R&D et d'industrialisation, pas une annonce de mise en production à grande échelle.

UELa levée de 700 M$ consolide la position de la Chine dans la course à l'IA incarnée, renforçant la pression concurrentielle indirecte sur les acteurs français et européens sans impact direct sur le marché UE à ce stade.

Chine/AsieOpinion
1 source
CacheMPC : commande prédictive par modèle certifiée avec cache pour la locomotion quadrupède
155arXiv cs.RO 

CacheMPC : commande prédictive par modèle certifiée avec cache pour la locomotion quadrupède

Une équipe de recherche propose CacheMPC, un mécanisme de mise en cache certifiée pour le Model Predictive Control (MPC) appliqué à la locomotion de robots quadrupèdes, publié sur arXiv (2606.28300). Le MPC constitue la couche prédictive standard dans les contrôleurs hiérarchiques de quadrupèdes, mais son solveur QP (programmation quadratique) recalculé à chaque cycle constitue un goulot d'étranglement sur processeur embarqué. Certified CacheMPC adresse ce problème via un cache indexé par Locality-Sensitive Hashing (LSH) de trajectoires de forces de contact, partitionné par mode de contact. Chaque entrée récupérée est acceptée uniquement si un certificat a posteriori confirme la faisabilité primale et une borne supérieure sur la sous-optimalité via le dual gap lagrangien. Le contrôleur combine récupération certifiée top-K, solveur QP à deadline bornée, et fallback sur la dernière solution certifiée. Validé sur un Unitree Go2, le système a été évalué sur 2 038 essais MuJoCo en froid contrôleur, dont une campagne de 600 essais à n=50 sur trois cellules à la frontière d'échec, puis déployé physiquement sur le NVIDIA Orin NX embarqué du robot. Le cache sans filtrage atteint un gain médian de 25x en temps de calcul en simulation, et 18,7x sur hardware réel. L'enjeu industriel est direct : MPC haute fréquence sur SoC embarqué standard (Orin NX, environ 10-15W) sans recourir à un ASIC dédié ou à une approximation neuronale. Un facteur 18,7x de réduction du temps de solve ouvre la porte à des boucles de contrôle plus rapides sur des plateformes commerciales comme le Go2, utilisé massivement dans la recherche académique et les pilotes industriels légers. La certification formelle distingue cette approche des méthodes d'apprentissage du MPC (neural MPC, learning-based warm-starting) qui offrent des speedups similaires mais sans garantie exploitable. Nuance importante : la contribution du certificat à la stabilité en boucle fermée n'est pas statistiquement résolvable à la taille d'échantillon actuelle (n=50). Aucune différence significative n'a été détectée entre les variantes avec et sans cache, ce qui est honnête scientifiquement mais laisse la question de sécurité formelle ouverte. Le MPC pour locomotion quadrupède s'est imposé depuis les travaux d'ETH Zurich (ANYmal) et du MIT (Cheetah), avec des implémentations ouvertes comme ACADOS ou OSQP qui restent les références en solve embarqué. CacheMPC s'inscrit dans un courant distinct : plutôt qu'accélérer le solveur ou substituer le MPC par un réseau de neurones, il exploite la répétabilité des gaits locomoteurs pour réutiliser des solutions passées. Les concurrents directs incluent les approches de warm-starting par apprentissage (DeepMPC, L4DC 2024) et les approximateurs explicites de MPC. Le Unitree Go2 est devenu le benchmark de facto à petit budget pour ce type de validation hardware. Les prochaines étapes naturelles seraient une campagne avec n significativement plus grand pour trancher sur la sécurité certifiée, et une extension aux bipèdes ou aux transitions de mode de contact plus complexes.

RecherchePaper
1 source
UBTECH vend 5 000 robots compagnons en deux semaines et vise une percée sur le marché grand public
156Pandaily 

UBTECH vend 5 000 robots compagnons en deux semaines et vise une percée sur le marché grand public

UBTECH, le fabricant de robots humanoïdes coté à Hong Kong, a enregistré plus de 5 000 précommandes pour son robot compagnon U1 en moins de deux semaines après son lancement début juin sur JD.com et Tmall, soit près de cinq fois ses ventes totales de robots humanoïdes pleine taille sur l'ensemble de l'année 2025 (1 079 unités). L'U1 est proposé en versions masculine et féminine, équipé de 88 articulations motorisées à haute liberté de mouvement, et positionné explicitement comme robot de compagnie émotionnelle pour les foyers. UBTECH vise 10 000 unités produites pour la série U1 d'ici fin 2026, en parallèle d'un objectif équivalent de 10 000 robots industriels. Sur le plan financier, la société affiche un chiffre d'affaires de 2,0 milliards de RMB en 2025, des pertes nettes de 703 millions de RMB (en recul par rapport à 1,12 milliard en 2024), et une capitalisation boursière d'environ 49 milliards HKD. La dépense en R&D atteint 507 millions de RMB, un ratio particulièrement élevé ramené au chiffre d'affaires. À noter : les 5 000 chiffres communiqués sont des précommandes, pas des livraisons confirmées. Ce signal commercial est significatif parce qu'il intervient dans un contexte où les fabricants chinois de robots humanoïdes cherchent à passer de l'expérimentation industrielle à une commercialisation réelle à grande échelle. Qu'un robot à 760 000 RMB de prix moyen génère un tel volume de précommandes grand public en quinze jours suggère un appétit domestique plus précoce qu'anticipé pour les compagnons IA embodied. Cela dit, UBTECH subit une pression tarifaire structurelle : Unitree, dont le G1 s'affiche sous les 100 000 RMB, revendique 60 % de marge brute grâce à une intégration verticale agressive, et avait déjà capté l'attention mondiale avec ses robots danseurs au Gala du Printemps 2025. Cette guerre des prix contraint UBTECH à justifier un premium par la profondeur de son stack technique, ce qui alourdit ses dépenses mais fragilise sa position face aux intégrateurs industriels sensibles au coût. UBTECH existe depuis une dizaine d'années et a construit une approche full-stack rare dans le secteur : modèle d'IA incarnée Thinker, réseau d'intelligence en essaim BrainNet 2.0, et fabrication de ses propres moteurs articulaires. Sa feuille de route officielle prévoyait d'abord l'industrie, puis les environnements commerciaux, puis le grand public. Ce lancement U1 anticipe la troisième phase, probablement sous pression concurrentielle et financière : les flux de trésorerie opérationnels restent négatifs à hauteur de 780 millions de RMB, et les créances clients atteignent 1,3 milliard de RMB dont plus de 40 % dépassent un an d'ancienneté, reflet d'une base clients très concentrée sur les administrations. Son principal concurrent industriel, Zhiyuan Robot, a expédié 5 100 unités en 2025 et vise "des dizaines de milliers" en 2026. La série Walker S d'UBTECH doit elle aussi atteindre 5 000 livraisons en 2026. Les prochaines semaines de conversion de précommandes en commandes fermes constitueront le vrai test de la demande consommateur.

Chine/AsieOpinion
1 source
MPC-Injection : orienter le RL de locomotion hors-politique vers les bassins d'attraction du contrôleur
157arXiv cs.RO 

MPC-Injection : orienter le RL de locomotion hors-politique vers les bassins d'attraction du contrôleur

Des chercheurs ont publié en juin 2026 sur arXiv une méthode baptisée MPC-Injection, conçue pour résoudre un problème récurrent dans l'entraînement par renforcement appliqué à la locomotion robotique : la convergence vers des comportements localement optimaux mais inutilisables en production, comme des membres qui vibrent en place ou un robot qui progresse en se traînant sur son torse. La technique consiste à injecter dans le replay buffer, la mémoire d'expériences utilisée par les algorithmes off-policy, des transitions générées par un contrôleur MPC (Model Predictive Control) résolvant le même problème de décision séquentielle. Le comportement préféré du concepteur est ainsi transféré à la politique apprise, non par une modification de la récompense, mais uniquement par le biais de la distribution des états explorés. Les auteurs valident l'approche sur un marcheur 2D en simulation, puis en transfert sim-to-real sur le quadrupède Go2 de Unitree Robotics, un robot commercialement disponible. L'intérêt principal est la simplicité du surcoût. Là où le reward shaping classique exige jusqu'à vingt et un termes de récompense soigneusement ajustés, MPC-Injection produit des allures qualitativement comparables avec une récompense à un ou deux termes seulement. Contrairement à l'adversarial motion prior (AMP) et aux méthodes d'imitation adversariale, la méthode ne nécessite ni discriminateur, ni retargeting cinématique, ni objectif auxiliaire. C'est un résultat notable : il suggère que la distribution des états du replay buffer est un levier de guidage aussi puissant que la forme de récompense ou l'imitation explicite, ce qui simplifie considérablement le pipeline d'ingénierie pour les équipes qui déploient des robots sur du matériel réel. La méthode s'inscrit dans un effort plus large de la communauté pour réduire le sim-to-real gap sans multiplier les hypothèses sur la dynamique du robot. Le Go2 de Unitree est devenu un banc de test de référence pour ces travaux, utilisé notamment dans des recherches concurrentes sur les VLA (Vision-Language-Action models) et les politiques de locomotion neuronales. Les alternatives directes, reward shaping multi-termes, AMP de Berkeley, méthodes de retargeting par mocap, ont toutes un coût d'implémentation ou de collecte de données plus élevé. MPC-Injection se positionne comme un pont pragmatique entre contrôle classique et apprentissage, particulièrement pertinent pour les équipes disposant déjà d'un contrôleur MPC opérationnel et souhaitant affiner une politique RL sans repartir de zéro sur la définition de récompense.

RecherchePaper
1 source
Vidéo : une entreprise chinoise montre un modèle unique pilotant à la fois un humanoïde et un bras robotique
158Interesting Engineering 

Vidéo : une entreprise chinoise montre un modèle unique pilotant à la fois un humanoïde et un bras robotique

MindOne Robotics, startup chinoise fondée à Shenzhen en 2025, a présenté une démonstration de son framework robotique Mind-0, capable de piloter simultanément des robots humanoïdes Unitree G1 et des systèmes bras-double fixes à partir d'un unique modèle d'IA. Le scénario illustré couvre un workflow logistique complet: récupération d'objets, transport, emballage et fermeture de caisses, avec une flotte mixte opérant sous la même intelligence centralisée. L'entreprise revendique une précision de manipulation inférieure au centimètre sur la plateforme Unitree G1 en conditions réelles. L'architecture Mind-0 sépare le raisonnement de haut niveau (perception, planification, décision) du contrôle moteur bas niveau, ce qui permet de déployer le même cerveau logiciel sur des morphologies différentes sans pipeline d'entraînement séparé par plateforme. Particularité notable: le modèle est entraîné exclusivement sur des données humaines capturées par motion capture corps entier, caméras égocentrées et dispositifs manuels, et non sur de la téléopération robot directe, ce que MindOn présente comme un moyen de préserver les comportements naturels de résolution de problèmes. L'enjeu industriel est double. D'abord, l'agnosticisme matériel: si un seul modèle orchestre humanoïdes et bras fixes sur une même tâche, les intégrateurs n'ont plus à développer des pipelines d'IA distincts par plateforme, ce qui réduit le coût d'entrée dans les déploiements multi-robots. Ensuite, MindOn s'attaque frontalement au sim-to-real, l'un des verrous les plus persistants de la robotique moderne: son Real-World Execution Compensation Model utilise un volume réduit de données réelles pour corriger les dérives dues aux différences de dynamique entre simulation et environnement physique. Les métriques annoncées (précision sub-centimétrique sur une démonstration sélectionnée) restent toutefois à valider dans des conditions de déploiement industriel répétable, avec cadences et taux d'erreur documentés. Le système de raisonnement hiérarchique compensant les délais d'actuation répond par ailleurs à un problème souvent sous-estimé: contrairement aux démonstrations humaines, les robots subissent des latences de capteur, de calcul et d'actionneur que le modèle doit continuellement corriger en temps réel. MindOne Robotics évolue dans un espace concurrentiel très chargé. Sur l'agnosticisme matériel et les modèles unifiés cross-embodiment, elle fait face à GR00T N2 de NVIDIA (conçu pour humanoïdes multiples), à pi0 de Physical Intelligence (modèle généraliste pour la manipulation), ainsi qu'aux stacks maison de Fourier Intelligence et d'Unitree. En Europe, Enchanted Tools avec son robot Miroka et Wandercraft positionnent des approches verticales différentes. MindOne reste une très jeune société, et cette démonstration constitue à ce stade un teaser technologique, non un produit commercialement déployé: aucun client pilote ni délai de mise en production n'ont été annoncés publiquement. L'entreprise indique vouloir étendre ses datasets humains et industrialiser son pipeline cross-embodiment, sans préciser de calendrier.

UELa montée en puissance de l'approche cross-embodiment chinoise (Mind-0) crée une pression concurrentielle indirecte sur les acteurs français Enchanted Tools et Wandercraft, qui développent des approches verticales différentes sans modèle unifié cross-morphologie.

Chine/AsieOpinion
1 source
Le robot humanoïde gravit un sommet de 6 000 mètres pour la première fois, cap ensuite sur l'Everest
159Pandaily 

Le robot humanoïde gravit un sommet de 6 000 mètres pour la première fois, cap ensuite sur l'Everest

En juin 2026, un robot humanoïde Unitree G1 modifié, baptisé Pemba José Lani, a atteint le sommet du volcan Chimborazo en Équateur (6 310 mètres), devenant le premier humanoïde à franchir le seuil des 6 000 mètres. L'expédition a été organisée par Geologic Dome, une startup américaine fondée par Pablo Berlanga Boemare, 23 ans. L'ascension totale a duré 16 heures, dont 5,5 heures pour le push final, un rythme comparable à celui d'un alpiniste humain entraîné. Pour résister aux conditions extrêmes, le robot a été équipé d'une veste de montagnard professionnelle, de guêtres, de chaussures à microcrampons et d'un système de ventilation abdominale pour maintenir les batteries à température optimale. Avant le départ, 72 heures d'entraînement par imitation de mouvement ont été réalisées, le chef d'équipe portant un casque VR et des traqueurs de chevilles pour transmettre des patterns d'équilibre au robot. L'autonomie restait partielle : Pemba marchait seul sur les pentes inférieures à 30 degrés ; au-delà, quatre guides le portaient. Ce n'est pas l'exploit sportif lui-même qui compte, mais les données opérationnelles collectées sur la résilience thermique et mécanique du G1 en milieu non structuré. Unitree avait certes testé la plateforme à près de -50°C dans la région de l'Altaï du Xinjiang, mais une traversée de 16 heures en haute altitude constitue un benchmark différent des cycles courts en laboratoire ou des démos en entrepôt contrôlé. Pour les acteurs du monitoring environnemental en terrain difficile, les robots à pattes commencent à apparaître comme une alternative crédible aux caméras fixes et aux drones, notamment dans les canopées forestières denses où ces derniers ne peuvent opérer. Les plateformes humanoïdes compactes comme le G1 (environ 35 kg) pourraient ouvrir un segment que les AMR à roues ne peuvent adresser, à condition toutefois que les preuves d'endurance multi-heures en conditions réelles se confirment au-delà d'expéditions isolées. Le projet s'enracine dans le parcours de Berlanga, ancien chargé de surveillance à distance pour le WWF au Parc National de la Salonga au Congo, dont l'intuition fondatrice est de "donner des jambes aux caméras" pour le suivi de biodiversité en terrain inaccessible. Le financement provient d'Eastworlds Labs, l'initiative robotique du protocole crypto Virtuals Protocol, un modèle inhabituel dans le secteur robotique. Le nom Pemba José Lani renvoie à un plan dit "triple couronne" : Chimborazo, puis Mauna Kea à Hawaï, et enfin l'Everest. Une demande d'expédition de 52 jours a été soumise au département du tourisme du Népal, avec pour objectif la collecte de données de mobilité et d'autonomie batterie entre le camp de base et le camp 4. Sur le créneau de l'exploration extrême en extérieur, les grands acteurs humanoïdes, Boston Dynamics, Figure, Agility Robotics et Unitree eux-mêmes, concentrent leurs efforts sur les environnements industriels contrôlés, laissant ce segment largement non disputé pour l'instant.

HumanoïdesPaper
1 source
Estimation d'état proprioceptive invariante pour robots humanoïdes sur sol non inertiel
160arXiv cs.RO 

Estimation d'état proprioceptive invariante pour robots humanoïdes sur sol non inertiel

Des chercheurs proposent sur arXiv (2606.19512) un filtre de Kalman étendu invariant (InEKF) pour estimer en temps réel l'état d'un robot humanoïde se déplaçant sur un sol en mouvement, sans aucun capteur externe. L'approche exploite uniquement les IMU montées aux pieds et la cinématique du robot pour estimer la position et la vitesse de la base dans le référentiel d'un sol non-inertiel, qu'il tangue, oscille ou pivote. Testée sur le robot Digit d'Agility Robotics en station debout avec tangage et oscillation latérale, puis en marche sur un sol en rotation uni-axiale, la méthode affiche une accélération de 96 % du taux de convergence et une réduction de 80 % des erreurs de position face aux InEKF classiques. En déplacement, l'erreur moyenne reste inférieure à 9 cm pour une erreur initiale pouvant atteindre 1 mètre. L'intérêt est immédiat pour tout déploiement hors sol fixe : bateaux, véhicules logistiques, quais portuaires, plateformes vibrantes d'usine. Reposer entièrement sur la proprioception embarquée supprime la dépendance aux systèmes de localisation externe (LIDAR, caméras, motion capture) souvent absents ou peu fiables dans ces contextes. L'analyse formelle d'observabilité démontre les conditions sous lesquelles position et vitesse relatives demeurent estimables malgré l'accélération du sol, ce qui dépasse le simple résultat empirique. Les expériences ont été conduites en conditions physiques réelles plutôt qu'en simulation seule, ce qui renforce la validité des métriques, même si les scénarios restent relativement contrôlés (mono-axial, uni-directionnel). Digit est développé par Agility Robotics, spin-off de l'Oregon State University rachetée par Amazon, qui déploie l'humanoïde dans des entrepôts logistiques. La méthode InEKF pour humanoïdes s'inscrit dans un corpus académique centré sur les groupes de Lie appliqués à l'estimation en robotique de terrain. Dans la course commerciale, Tesla (Optimus), Figure (Figure 03), Boston Dynamics (Atlas) et Unitree (H1, G1) investissent massivement dans la locomotion en milieux variés, mais le sol non-inertiel demeure un angle mort des pipelines de contrôle actuels. Ce preprint est vraisemblablement soumis à IROS 2026 ou ICRA 2027 et ne représente pas encore une capacité déployée en production.

RecherchePaper
1 source
Les précommandes du robot humanoïde UBTECH U1 approchent 5 000 unités en 17 jours
161Pandaily 

Les précommandes du robot humanoïde UBTECH U1 approchent 5 000 unités en 17 jours

En dix-sept jours à peine, UBTECH a enregistré près de 5 000 précommandes pour son robot humanoïde U1, depuis le lancement des préventes le 2 juin 2026. Au 18 juin, la boutique officielle de l'entreprise sur JD.com affichait plus de 4 600 réservations, pour une livraison prévue le 30 juin. Le U1 mesure 183 cm, pèse 42 kg et embarque 88 degrés de liberté ainsi qu'un modèle d'IA dédié à la compagnie émotionnelle. Il propose une personnalisation d'apparence multi-dimensionnelle, une connectivité Wi-Fi et une autonomie de 2 à 4 heures. L'appareil est commercialisé exclusivement auprès d'adultes, ciblant les citadins confrontés à l'isolement et les amateurs d'esthétiques subculturelles. Pour contextualiser l'ampleur de ce score : sur l'ensemble de l'année 2025, UBTECH n'avait vendu que 1 079 robots humanoïdes taille réelle. En parallèle, la société vise une capacité de production industrielle de 10 000 unités par an dès 2026 pour sa gamme B2B. Ces chiffres témoignent d'un changement de régime dans la filière humanoïde, mais méritent d'être lus avec précaution. Les précommandes ne sont pas des ventes livrées, et les métriques d'autonomie (2 à 4 heures) comme les fonctionnalités actuelles -- centrées sur la conversation plutôt que sur la manipulation physique -- posent des questions réelles sur la valeur d'usage. Cela dit, le signal commercial est réel : Deutsche Bank a révisé à la hausse sa prévision mondiale de livraisons de robots humanoïdes pour 2026, passant de 17 500 à près de 50 000 unités, dont environ 40 000 en provenance de Chine. Si ces volumes se confirment, ils valideraient le passage d'une phase de démonstration à une phase de déploiement à l'échelle, un seuil que beaucoup d'observateurs situaient encore à horizon 2028-2030. Le contexte sectoriel s'accélère sur tous les fronts. Unitree Robotics ambitionne de livrer entre 10 000 et 20 000 robots humanoïdes en 2026, contre environ 5 500 en 2025. AgiBot annonçait en mars 2026 avoir cumulé 10 000 robots embodied à usage général. Du côté des acteurs internationaux, Tesla a sorti les premières unités de production de l'Optimus Gen-3 de ses lignes, avec une montée en cadence prévue à Fremont dès le troisième trimestre 2026. BYD a confirmé développer des humanoïdes, et XPeng vise une production de masse au quatrième trimestre 2026. UBTECH, fondée en 2012 à Shenzhen et surtout connue pour ses robots éducatifs Alpha, opère ce pivot vers le grand public après des années de présence en B2B industriel. L'enjeu désormais est moins technologique que commercial : trouver l'équilibre entre maîtrise des coûts, définition claire des usages, et expérience utilisateur suffisante pour transformer une réservation en fidélité client.

UELa montée en puissance des fabricants chinois d'humanoïdes vers des volumes de masse en 2026 (40 000 unités prévues selon Deutsche Bank) accélère la pression concurrentielle mondiale sur les acteurs industriels européens comme ABB et KUKA.

Chine/AsieOpinion
1 source
Soutien politique et production de masse propulsent les ETF de robots humanoïdes à l'aube d'une phase critique
162Pandaily 

Soutien politique et production de masse propulsent les ETF de robots humanoïdes à l'aube d'une phase critique

La Chine accélère sa stratégie dans la robotique humanoïde : le ministère de l'Industrie et des Technologies de l'Information (MIIT), en coordination avec la SASAC (Commission de supervision des actifs d'État), a fixé un objectif contraignant de plus de 10 000 unités humanoïdes déployées d'ici fin 2026, signalant un passage de l'incitation à la R&D vers une obligation de déploiement industriel. Sur le plan production, le Centre d'innovation en robotique humanoïde de Pékin a confirmé que le Tiangong 3.0 entrera en fabrication en série au second semestre 2026, avec des réductions de coûts attendues supérieures à 50 %. UBTECH a formalisé une coentreprise pour développer des puces d'intelligence incarnée, avec un capital enregistré de 100 millions de yuans. Côté chaîne d'approvisionnement, Wanma et Langxin Electric ont commencé des livraisons en volume de composants critiques. À l'international, GenesisAI, soutenu par l'ex-PDG de Google Eric Schmidt, a lancé son robot industriel Eno, tandis que Faraday Future affirme avoir livré 157 unités réparties sur quatre modèles. Dans ce contexte, l'ETF Robot d'Invesco Great Wall (code 159559), indexé sur le Guozheng Robot Industry Index (980022), affiche une exposition de plus de 73 % aux valeurs du secteur humanoïde, avec une allocation sectorielle dominée par les équipements mécaniques à 47,23 % (réducteurs, vis à billes, moteurs) et les équipements électriques à 14,68 %. Ce moment marque une inflexion structurelle : la Chine ne pilote plus la filière par subventions symboliques mais par objectifs de déploiement chiffrés et datés, ce qui force les intégrateurs et les acheteurs industriels à anticiper des volumes réels dès 2026. La maturité affichée de la chaîne d'approvisionnement, notamment autour des composants à haute valeur (actionneurs, chips embarqués), réduit un des principaux goulets d'étranglement identifiés lors des phases pilotes. Toutefois, il convient de rester prudent : l'article source est en grande partie un texte promotionnel pour le fonds 159559 lui-même, dont la performance de 60,81 % sur deux ans est mise en avant face aux 34,02 % du CSI 300. Les chiffres de déploiement restent des objectifs politiques, pas des confirmations de livraisons effectives, et les vidéos de démonstration des robots ne constituent pas une preuve de passage à l'échelle industrielle. La trajectoire de la robotique humanoïde chinoise s'inscrit dans un effort stratégique accéléré depuis 2023, avec des acteurs comme Unitree, AgiBot et UBTECH qui avancent en parallèle. À l'international, Tesla (Optimus Gen 3), Figure (Figure 03), Physical Intelligence (pi0), Agility Robotics et Boston Dynamics maintiennent une pression concurrentielle forte, principalement sur les cas d'usage logistique et manufacture. Le second semestre 2026 et l'année 2027 sont désignés comme la première fenêtre de réalisation de revenus réels pour le secteur, sous réserve que les objectifs de déploiement se confirment en commandes fermes plutôt qu'en annonces de pilotes.

UELa montée en puissance industrielle chinoise dans les humanoïdes (objectif 10 000 unités d'ici fin 2026, passage aux mandats de déploiement) crée une pression concurrentielle indirecte sur les fabricants et intégrateurs européens de composants robotiques critiques (actionneurs, réducteurs, chips embarqués).

Chine/AsieActu
1 source
ZiMPedance : modélisation et contrôle ZMP intégrant l'impédance pour robots quadrupèdes transportant des charges
163arXiv cs.RO 

ZiMPedance : modélisation et contrôle ZMP intégrant l'impédance pour robots quadrupèdes transportant des charges

Des chercheurs ont publié une nouvelle méthode de contrôle pour quadrupèdes transportant des charges via des bras passifs à ressort, baptisée ZiMPedance. Le problème central : lorsqu'un quadrupède porte une charge suspendue à un bras passif (ressort et amortisseur, sans actionnement propre), la dynamique de cette interface génère des forces oscillatoires susceptibles de déstabiliser la locomotion. Les auteurs dérivent une formulation étendue du Zero Moment Point (ZMP), critère classique de stabilité en robotique de marche, intégrant explicitement les paramètres de raideur, d'amortissement et de masse de la charge. Cette formulation est ensuite incorporée dans un contrôleur prédictif (MPC) basé sur un modèle Single Rigid Body Dynamics augmenté des sous-systèmes passifs. En simulation, la méthode réduit les violations de stabilité par un facteur 10, de 7,0 % à 0,7 %, et abaisse l'effort en force de réaction au sol horizontale de 15 % par rapport à un contrôleur de référence. Les tests matériels ont utilisé une charge de 2 kg : le robot maintient une locomotion stable sous perturbations de type traction-relâchement là où le contrôleur nominal échoue. L'enjeu industriel est direct. Les bras passifs à ressort constituent une solution attractive pour équiper les quadrupèdes de capacités de transport sans alourdir la plateforme ni multiplier les actionneurs, contrairement aux manipulateurs actifs, plus lourds et plus coûteux. Le phénomène identifié ici, la résonance entre les configurations sous-amorties et les harmoniques de locomotion, représente un obstacle réel au déploiement en environnements non contrôlés. ZiMPedance démontre qu'il est possible de compenser ces effets par la modélisation plutôt que par le sur-actionnement, une approche directement transposable pour des cas d'usage logistiques, d'inspection industrielle ou de livraison de colis. Le même modèle permet en outre un suivi de position de l'effecteur via la dynamique passive, sans actionner le bras, ce qui ouvre des possibilités de contrôle indirect à faible coût énergétique. Ce travail s'inscrit dans la continuité des avancées MPC pour robots à pattes, un axe de recherche structurant depuis les développements autour de MIT Cheetah et ANYmal (ANYbotics). Dans le segment commercial, Boston Dynamics équipe Spot d'un bras actif à six degrés de liberté, Unitree propose des configurations payload sur ses quadrupèdes B1 et B2, et des acteurs européens comme Wandercraft ou Enchanted Tools explorent des architectures complémentaires pour la manipulation embarquée. Publié en preprint sur arXiv sous l'identifiant 2606.18883, ce travail n'a pas encore été soumis à révision par les pairs : les gains annoncés restent à valider en conditions de charge variable et sur terrain non structuré, hors cadre simulé.

UEMéthode potentiellement transposable pour des acteurs européens comme Wandercraft ou Enchanted Tools explorant la manipulation embarquée, mais aucun lien direct avec la France ou l'UE n'est documenté dans ce travail.

RecherchePaper
1 source
Le secret des robots humanoïdes victorieux en marathon
164IEEE Spectrum Robotics 

Le secret des robots humanoïdes victorieux en marathon

Le 19 avril 2026, le robot humanoïde Honor Lightning a complété un semi-marathon en 50 minutes et 26 secondes, battant le record mondial humain de 7 minutes et le meilleur temps robotique enregistré en 2025 de près de deux heures. Cette performance a été réalisée à une vitesse moyenne de 7 m/s, avec une consommation énergétique totale estimée à environ 400 W pour les membres inférieurs. L'élément distinctif du Lightning n'est ni une architecture de contrôle radicalement nouvelle ni une puissance moteur exceptionnelle : c'est un système de refroidissement liquide intégré directement dans chacun des quatre moteurs d'entraînement des membres inférieurs. Selon Honor, ces circuits liquides pénètrent les moteurs comme des capillaires, avec un débit d'échange thermique supérieur à 4 litres par minute et un circuit indépendant par moteur. Les actionneurs de hanche et de genou affichent un diamètre extérieur d'environ 110 à 150 mm, avec un rapport de réduction estimé à 45:1, optimisé pour la vitesse de course cible. La contrainte que cette architecture résout est strictement thermique. Faire courir un humanoïde de gabarit humain à 7 m/s génère inévitablement environ 150 W de chaleur dissipée au niveau du genou, quelle que soit l'efficacité du reste du système, et ce flux ne peut pas être évacué par convection naturelle de manière continue sur la durée d'un semi-marathon. C'est précisément ce verrou qu'illustre la performance d'Unitree lors de la même épreuve : le constructeur chinois, plus établi commercialement, a dû recourir à un sac à dos de glace pour tenter de terminer la course sans surchauffe. Apptronik avait exploré le refroidissement liquide sur plusieurs prototypes, mais ne l'intègre pas à son humanoïde principal Apollo. Pour les intégrateurs industriels et les décideurs B2B, ce résultat signale que l'endurance à haute cadence sera conditionnée moins par la puissance de calcul ou l'IA embarquée que par la gestion thermique des actionneurs, un critère rarement mis en avant dans les fiches produit des fabricants. Honor, fabricant de smartphones reconverti à la robotique humanoïde, reste discret sur la feuille de route commerciale du Lightning : aucun pilote industriel ni calendrier de mise sur le marché n'a été communiqué, et les spécifications moteur détaillées ne sont pas publiées. Cette course du 19 avril positionne néanmoins le Lightning directement face aux acteurs chinois Unitree et Agibot, ainsi qu'aux plateformes occidentales comme Figure (Figure 03), Boston Dynamics (Atlas) et Agility Robotics (Digit). Dans un secteur où l'écart entre démonstration contrôlée et déploiement réel reste souvent considérable, la nature ouverte et chronométrée de l'épreuve -- un vrai semi-marathon public, pas un parcours en laboratoire -- donne à ce résultat un caractère de benchmark difficile à relativiser. La prochaine étape logique pour Honor serait de publier les données thermiques détaillées et d'annoncer des collaborations industrielles pour valider le Lightning en conditions de production réelle, seul terrain qui transforme un record sportif en argument commercial.

HumanoïdesOpinion
1 source
OmniRetarget : génération de données préservant les interactions pour la loco-manipulation corps entier des humanoïdes
165arXiv cs.RO 

OmniRetarget : génération de données préservant les interactions pour la loco-manipulation corps entier des humanoïdes

OmniRetarget est un pipeline de génération de données pour l'apprentissage par renforcement (RL) sur robots humanoïdes, présenté dans un préprint arXiv (2509.26633, v3). Face au problème du retargeting, qui consiste à convertir des captures de mouvement humain en références cinématiques exploitables par un robot, les méthodes existantes produisent des artefacts physiquement incohérents comme le glissement des pieds (foot-skating) ou la pénétration de surfaces, et ignorent les interactions humain-objet et humain-environnement. OmniRetarget introduit un "interaction mesh", un maillage intermédiaire qui modélise et préserve explicitement les relations spatiales et de contact entre l'agent, le terrain et les objets manipulés, via une minimisation par déformation laplacienne sous contraintes cinématiques. Évalué sur les datasets OMOMO, LAFAN1 et des données MoCap propriétaires, il génère plus de 8 heures de trajectoires de meilleure qualité que les baselines de référence. Appliqué au robot humanoïde Unitree G1, il permet d'exécuter des tâches de parkour et de loco-manipulation sur des horizons allant jusqu'à 30 secondes, entraîné avec seulement 5 termes de récompense et sans curriculum d'apprentissage. L'intérêt pour les chercheurs et intégrateurs réside dans deux apports combinés : la qualité cinématique améliorée réduit le sim-to-real gap, tandis que la préservation des interactions permet d'augmenter une démonstration unique vers différentes morphologies de robots, terrains et configurations d'objets, multipliant l'efficacité de la donnée. Plus significatif encore, l'obtention de comportements de loco-manipulation longs et complexes avec seulement 5 termes de récompense partagés entre toutes les tâches contredit l'hypothèse sectorielle selon laquelle ce type de compétences exige un reward engineering élaboré ou un curriculum progressif. Le paradigme dominant pour l'apprentissage humanoïde repose sur le retargeting MoCap vers des références RL, aux côtés de la télé-opération et de l'imitation directe. Le Unitree G1, produit par le fabricant chinois Unitree Robotics, s'est imposé comme plateforme académique de facto dans ce domaine, face à l'Atlas de Boston Dynamics, aux humanoïdes de Figure AI et d'Agility Robotics. OmniRetarget reste à ce stade une contribution de recherche sans annonce de déploiement industriel ; sa robustesse dans des environnements non structurés, où la géométrie de contact est imprévisible, reste à démontrer hors laboratoire.

RecherchePaper
1 source
SAPS : autonomie partagée pour orienter la politique en combinant téléopération et VLA pré-entraîné
166arXiv cs.RO 

SAPS : autonomie partagée pour orienter la politique en combinant téléopération et VLA pré-entraîné

SAPS (Shared Autonomy for Policy Steering, arXiv:2606.15568) est un framework qui combine en temps réel les commandes d'un opérateur humain avec les actions d'un modèle Vision-Language-Action (VLA) préentraîné, au niveau de l'action elle-même. Sans réentraînement, sans modèle auxiliaire, sans modification architecturale, SAPS introduit trois stratégies d'arbitrage dont une basée sur la similarité cosinus: cet indice mesure l'accord géométrique entre la commande humaine et celle du modèle pour distribuer le contrôle de façon dynamique. Testé sur les benchmarks de simulation LIBERO, LIBERO-PRO et CALVIN, et sur du matériel réel, le framework améliore le taux de succès des tâches jusqu'à 82 % par rapport à l'exécution autonome seule, réduit les interventions humaines par rapport à la télé-opération pure, et raccourcit les temps de complétion dans les deux cas. Ce résultat touche au défaut structurel des VLA généralistes: leur fragilité face aux perturbations hors-distribution, qu'il s'agisse d'un objet déplacé de quelques centimètres ou d'une scène atypique. SAPS n'exige pas de modifier le modèle existant, ce qui est l'argument commercial central pour un intégrateur industriel: le framework se greffe indifféremment sur Pi-0, GR00T N2, OpenVLA ou tout autre VLA disponible. La réduction de charge cognitive par rapport à la télé-opération pure est également significative pour des applications d'assistance aux personnes à mobilité réduite et pour la collecte de données d'imitation, où chaque heure d'opérateur est coûteuse. Les métriques présentées sont issues d'un preprint non relu par des pairs, et les vidéos de démonstration réelles restent à évaluer avec prudence. L'autonomie partagée est un champ établi, mais son application agnostique au modèle au niveau action sur des VLA modernes est une voie distincte des approches concurrentes. Physical Intelligence (Pi-0), NVIDIA (GR00T N2) et HuggingFace (LeRobot) misent sur la robustification des politiques par distillation et augmentation de données; SAPS propose une couche d'intervention humaine plug-and-play plutôt qu'un meilleur modèle. Le preprint n'annonce ni déploiement industriel ni partenariat commercial. Les extensions naturelles visent les plateformes humanoïdes (Figure 03, Unitree G1) et un usage dans des boucles de fine-tuning continu. Aucun acteur français ou européen n'est impliqué dans ce travail.

RechercheOpinion
1 source
LoComposition : locomotion quadrupède économe en énergie et adaptée au terrain, sans a priori de démarche
167arXiv cs.RO 

LoComposition : locomotion quadrupède économe en énergie et adaptée au terrain, sans a priori de démarche

Une équipe de chercheurs publie LoComposition (arXiv:2606.15896, juin 2026), une méthode d'apprentissage par renforcement pour la locomotion quadrupède qui décompose les objectifs en mécanismes distincts plutôt que de les fusionner dans une fonction de récompense monolithique. Le système confie à des composants séparés ce que les approches classiques entremêlent : les récompenses gèrent la spécification de tâche, des contraintes encadrent les limites opérationnelles, la minimisation d'énergie pilote les préférences de démarche, et la perception extéroceptive (cartographie d'élévation LiDAR) adapte la consommation énergétique à la difficulté du terrain. Par rapport à une baseline conventionnelle à récompense complexe, LoComposition atteint des performances comparables de franchissement de terrain tout en réduisant le coût de transport de 56 % et les violations de limites opérationnelles de 96 %. La politique entraînée en simulation se transfère ensuite en zero-shot sur un robot quadrupède Unitree Go2 physique sans recalibration manuelle. L'apport central est la suppression des gait priors explicites, c'est-à-dire les cibles de temps de vol, de nombre de contacts au sol et de clairance des pieds, au profit de comportements de démarche émergents. Pour les équipes d'intégration, cela signifie moins d'ingénierie manuelle des récompenses et une meilleure généralisation à des terrains non vus en entraînement. La réduction de 56 % du coût de transport est directement pertinente pour les déploiements sur batteries à autonomie prolongée, scénario typique de l'inspection industrielle ou de la surveillance de site. L'analyse par ablation des chercheurs, montrant que retirer chaque composant expose un mode d'échec distinct, valide la cohérence de l'architecture et confirme que les gains ne sont pas le résultat d'un ajustement opportuniste des hyperparamètres. Cette contribution s'inscrit dans la dynamique de locomotion quadrupède par renforcement dominée depuis 2020 par le Robotics Systems Lab de l'ETH Zurich (ANYmal, séries RMA et Parkour) et Carnegie Mellon University. Le Unitree Go2, plateforme commerciale accessible, est devenu un banc d'essai standard pour la recherche académique, ce qui facilite la reproductibilité des résultats. Du côté industriel, ANYbotics et Boston Dynamics (Spot) développent des solutions propriétaires sur des trajectoires similaires mais ne publient pas leurs méthodes. LoComposition reste à ce stade une contribution de recherche fondamentale : aucun pilote industriel ni timeline de commercialisation n'est annoncé dans le preprint.

RecherchePaper
1 source
Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger
168Pandaily 

Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger

Le robot humanoïde G1 de Unitree Robotics est devenu en quelques semaines un phénomène viral mondial, déployé dans des contextes radicalement différents selon les pays. En Corée du Sud, un G1 a été ordonné moine bouddhiste au temple Jogyesa de Séoul sous le nom de "Gabi", revêtu d'une robe monastique grise et d'un chapelet, ayant reçu les cinq préceptes dont l'interdiction de "surcharger" -- précepte que les journalistes coréens ont vérifié techniquement, confirmant que le BMS du robot coupe effectivement la charge automatiquement. Au Japon, le temple Seirenji de Kyoto héberge un "Buddharoid" basé sur la même plateforme G1, équipé d'un LLM entraîné sur des sutras et couplé à ChatGPT, capable de mener des séances de conseil individuel avec les visiteurs. En Pologne, un G1 baptisé "Edek" déambule dans Varsovie avec un sac à dos Adidas et une Rolex ornée de diamants, générant du contenu viral en simulant des commandes chez McDonald's, en intervenant à la radio nationale et en prononçant des discours au parlement polonais. Aux États-Unis, "Jake", un G1 customisé en "bro" de l'ère IA avec chapeau de cowboy et chaîne en argent, a déclenché une controverse après une altercation physique avec le streameur IShowSpeed, aboutissant à des accusations d'agression et à une plainte en justice à hauteur d'un million de dollars déposée par sa société de management, RizzBot. Ces déploiements révèlent une dynamique inattendue : le G1 de Unitree, commercialisé autour de 16 000 dollars, s'avère suffisamment accessible pour que des acteurs indépendants -- temples, créateurs de contenu, agences de divertissement -- l'intègrent sans soutien industriel lourd. Le robot humanoïde devient ainsi un vecteur de présence culturelle avant d'être un outil de productivité. Pour les décideurs et intégrateurs, ce phénomène signale que la barrière à l'adoption n'est plus uniquement technique ou financière, mais narrative : le premier humanoïde qui capte l'attention devient une référence de marché, indépendamment de ses capacités réelles en manipulation ou locomotion. Ces usages ne prouvent pas la résolution du sim-to-real gap ni la viabilité industrielle -- les vidéos restent sélectionnées, les environnements contrôlés -- mais ils démontrent que la forme humanoïde génère une adhésion sociale difficile à obtenir avec les AMR classiques. Unitree Robotics, fondée en 2016 à Hangzhou, s'est imposée dans le segment des robots quadrupèdes bon marché avant de lancer le G1 en 2024 comme humanoïde d'entrée de gamme. La société évolue dans un écosystème concurrentiel dense : Figure AI (Figure 03), Boston Dynamics (Atlas), 1X Technologies, et côté chinois Agibot, Fourier Intelligence et UBTECH, tous positionnés sur des segments industriels avec des arguments de payload et de robustesse que le G1 ne revendique pas. La stratégie de Unitree semble délibérément différente -- volume, prix, accessibilité -- et ces déploiements viraux, qu'ils soient spontanés ou orchestrés, construisent une notoriété mondiale qui précède toute annonce de pilote industriel formel.

UEUn acteur indépendant polonais déploie déjà le G1 d'Unitree à Varsovie, signalant que la barrière financière à l'adoption d'humanoïdes en Europe est passée sous 20 000€ et accessible à des non-industriels.

Chine/AsieOpinion
1 source
RealDexUMI : interface portable universelle pour l'apprentissage de la manipulation dextérique
169arXiv cs.RO 

RealDexUMI : interface portable universelle pour l'apprentissage de la manipulation dextérique

RealDexUMI est une interface de téléopération portable présentée en juin 2026 par des chercheurs de BeingBeyond dans un preprint arXiv (arXiv:2606.06033). Le dispositif repose sur un module d'effecteur terminal partagé combinant une main robotique légère, une caméra embarquée dans la paume et des capteurs tactiles au bout des doigts. Un gant isomorphe porté par l'opérateur humain traduit les mouvements des doigts en commandes articulaires directes sur la main robotique, sans retargeting ni conversion d'incarnation. Le système a été évalué sur huit tâches réelles couvrant des manipulations fines, riches en contacts, à longue durée et bimanuelles, obtenant un taux de succès moyen de 88,75%. Les politiques apprises se généralisent à des poses initiales non vues lors de l'entraînement et ont été transférées vers trois morphologies de robots différentes. Le verrou que RealDexUMI cherche à lever est connu dans le secteur sous le nom de "collection-to-deployment gap". Les pipelines classiques de collecte de données pour la manipulation dextre font face à un dilemme : la motion capture ou les gants souples permettent une collecte rapide mais nécessitent un retargeting qui dégrade la fidélité des contacts, tandis que la téléopération robot-spécifique préserve cette fidélité mais reste onéreuse et difficile à passer à l'échelle. RealDexUMI propose un troisième chemin via un effecteur "zéro-gap" : les observations (images embarquées, signaux tactiles, contacts, commandes articulaires) sont identiques entre collecte et déploiement, supprimant le biais d'observation qui dégrade souvent les politiques d'imitation. Un taux de 88,75% sur des tâches bimanuelles longue durée est significatif si les conditions expérimentales sont représentatives, bien que le preprint ne détaille pas encore la distribution des tentatives par tâche ni les protocoles de randomisation des scènes. La question de l'interface universelle de manipulation dextre est activement travaillée depuis plusieurs années, notamment depuis les travaux UMI de Columbia University (2023-2024), qui instrumentaient une spatule pour des robots standard. RealDexUMI étend ce paradigme aux mains multi-doigts, terrain nettement plus difficile. La démarche entre en compétition directe avec des approches comme ALOHA 2 et ACT de Carnegie Mellon, les systèmes de DexHand Research, ou les plateformes bimanuelle d'Apptronik et Agility Robotics. En Europe, des équipes de l'ISIR à Sorbonne Université et du DLR en Allemagne travaillent sur des thématiques proches de capture et transfert de manipulation dextre. BeingBeyond reste discret sur son positionnement commercial et ses partenaires industriels : la prochaine étape naturelle serait une validation dans des environnements non structurés ou une intégration sur des plateformes humanoïdes commerciales comme Figure 03, Unitree G1 ou Fourier GR-1, où la manipulation dextre demeure le principal goulot d'étranglement.

UELes équipes européennes de manipulation dextre (ISIR/Sorbonne, DLR) pourraient intégrer l'approche zéro-gap de RealDexUMI pour accélérer leurs pipelines de collecte de données sans retargeting.

RechercheOpinion
1 source
Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes
170arXiv cs.RO 

Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes

Une équipe de chercheurs a publié sur arXiv (référence 2605.31343, mai 2026) un framework baptisé TA-WBC (Terrain-Aware Whole-Body Control) destiné aux manipulateurs à pattes, c'est-à-dire des robots combinant membres locomoteurs (quadrupèdes ou bipèdes) et bras articulés. Le coeur du système est une politique unifiée entraînée par apprentissage par renforcement (RL) qui pilote simultanément les jambes et le bras lors de tâches de loco-manipulation, terme désignant la capacité à se déplacer et manipuler des objets en même temps. L'architecture repose sur trois briques techniques : un encodeur d'extéroception hybride qui extrait en temps réel les caractéristiques du terrain, une méthode d'échantillonnage de l'effecteur final ancrée sur le plan de contact des pieds pour découpler la cible de manipulation des oscillations du torse, et un module de distillation à double politique pour intégrer motricité étendue et adaptabilité sans effacement catastrophique des compétences acquises. Les expériences en simulation et en environnement réel montrent une zone atteignable agrandie, une erreur de tracking réduite et moins de trébuchements imprévus. Ce travail s'attaque à une limitation structurelle des contrôleurs corps entier existants : leur dépendance quasi exclusive à la proprioception (capteurs internes, IMU, encodeurs) au détriment de l'extéroception (perception externe du terrain). En milieux industriels complexes comme les chantiers, les entrepôts en hauteur variable ou les sites nucléaires, cette lacune rend les plateformes mobiles-manipulatrices peu fiables dès que le sol n'est plus plan. Le découplage effecteur/torse est particulièrement notable pour les intégrateurs : il signifie que le bras peut maintenir une trajectoire stable même quand le corps compense une marche irrégulière, ce qui est un prérequis non négociable pour tout assemblage ou saisie de précision en terrain dégradé. La validation sim-to-real, même partielle, renforce la crédibilité d'une approche qui reste à ce stade un preprint non commercialisé. Les manipulateurs à pattes constituent une catégorie en pleine structuration. Boston Dynamics commercialise Spot avec bras depuis 2021, Unitree propose le B2W équipé d'un bras, et plusieurs laboratoires académiques majeurs (ETH Zurich, CMU, Berkeley) publient régulièrement sur la loco-manipulation. Le verrou que TA-WBC cherche à lever, la perception de topologie de terrain couplée au contrôle corps entier, est précisément ce qui freine le déploiement de ces plateformes au-delà des environnements structurés. Ce preprint n'annonce pas de produit ni de partenaire industriel ; il pose néanmoins une brique algorithmique que des acteurs comme Agility Robotics, Apptronik ou les équipes robotique de Google DeepMind pourraient intégrer dans leurs chaînes d'entraînement.

UETravail de recherche applicable aux déploiements industriels en environnements dégradés (sites nucléaires, entrepôts à topologie variable) présents en Europe, mais sans implication directe d'acteurs français ou européens.

RecherchePaper
1 source
Le sommet de Tokyo impressionne avec des humanoïdes et des mains robotiques capables d'enfiler une aiguille
171Interesting Engineering 

Le sommet de Tokyo impressionne avec des humanoïdes et des mains robotiques capables d'enfiler une aiguille

Au Humanoids Summit 2026 de Tokyo, organisé les 28 et 29 mai, une vingtaine d'entreprises mondiales ont présenté leurs dernières plateformes humanoïdes devant un public d'ingénieurs et de décideurs industriels. Honda y a démontré une main robotique hautement dextre capable d'enfiler une aiguille et de serrer de minuscules boulons, illustration concrète de l'expertise japonaise en manipulation de précision. La startup japonaise GMO dévoilait un humanoïde destiné à la manutention fret aéroportuaire et au support logistique, conçu pour s'insérer sans modification dans les workflows humains existants via un système de vision par caméra, mais dont le coeur mécanique a été fourni par le chinois Unitree. Ce même Unitree présentait également un robot quadrupède à mobilité tout-terrain. Les entreprises chinoises Booster Robotics et LimX Dynamics figuraient parmi les exposants notables, aux côtés de Boston Dynamics et Toyota. En marge du salon, une université japonaise annonçait l'ouverture d'un laboratoire médical piloté par dix robots, dont le Maholo LabDroid, visant une automatisation complète des expériences sans personnel humain permanent. Le sommet de Tokyo cristallise une bifurcation stratégique dans la course mondiale aux humanoïdes : d'un côté le Japon et ses démonstrations de haute précision, de l'autre les acteurs chinois qui misent sur l'industrialisation rapide et les coûts de production réduits. Le fait que GMO, entreprise japonaise, s'appuie sur les composants robotiques d'Unitree pour son humanoïde aéroportuaire illustre ce rééquilibrage : les intégrateurs et OEM japonais adoptent des sous-ensembles chinois pour rester compétitifs, creusant l'écart entre l'image de maîtrise technologique nationale et la réalité de la chaîne d'approvisionnement. Pour les décideurs B2B, l'enjeu est double : la maturité des VLA (vision-language-action models) progresse assez pour justifier des pilotes en conditions réelles (fret aérien, logistique), mais la plupart des démonstrations présentées restent des showcases contrôlés, pas des déploiements en série. La main dextre de Honda impressionne sur scène ; en production, le delta entre la performance en laboratoire et la robustesse opérationnelle sur des volumétries significatives reste à valider. Cette dynamique s'inscrit dans une crise démographique structurelle : le Japon est la société la plus vieillie du monde, avec 28,7 % de sa population âgée de 65 ans ou plus, une population en recul de 127 millions d'habitants en 2015 vers une projection de 88 millions en 2065, et un tiers des habitants qui sera septuagénaire dès 2036. Face à une pénurie de main-d'oeuvre que les politiques d'immigration restrictives du pays n'atténuent pas, l'automatisation n'est plus un avantage concurrentiel mais une nécessité opérationnelle. Ce terrain favorable explique pourquoi les entreprises chinoises ciblent explicitement le marché japonais : Unitree, déjà présent via GMO, et ses concurrents Booster Robotics et LimX Dynamics y voient un client industriel à fort pouvoir d'achat, culturellement réceptif aux robots. Boston Dynamics et Toyota maintiennent un positionnement premium sur la robustesse et les cas d'usage professionnels. Les prochaines échéances à surveiller sont les pilotes d'humanoïdes en environnement aéroportuaire annoncés par GMO et la montée en charge des robots médicaux autonomes dans les universités japonaises, deux secteurs où la régulation et la validation de sécurité constitueront les vrais goulots d'étranglement.

UEL'adoption par des intégrateurs japonais de composants Unitree illustre la compétitivité croissante des fournisseurs chinois de sous-systèmes robotiques, une dynamique que les acheteurs et intégrateurs industriels européens devront intégrer dans leurs arbitrages de chaîne d'approvisionnement.

Chine/AsieOpinion
1 source
Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée
172Interesting Engineering 

Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée

Astribot, startup robotique de Shenzhen également connue sous le nom Stardust Intelligence, a ouvert les commandes de son humanoïde T1 à partir de 13 000 dollars, soit environ sept fois moins cher que son propre modèle phare S1 vendu près de 100 000 dollars. Le T1 est un humanoïde à base roulante de 155 cm pour 66 kg, doté de 23 degrés de liberté hors effecteurs, avec une capacité de charge de 5 kg par bras. Son architecture motrice repose sur des câbles tendus, la même approche que le S1, conçue pour produire des mouvements plus fluides qu'un entraînement par engrenages traditionnels. Il accepte des pinces robotiques standard et des mains à cinq doigts pour la manipulation fine, et cible des applications comme la cuisine, les opérations en laboratoire, le pliage du linge, le tri de pièces automobiles et la recharge de véhicules électriques. L'IA embarquée est entraînée principalement par démonstration humaine plutôt que par téléopération, une méthode d'imitation learning qui permet au robot d'apprendre des workflows en observant un opérateur humain. Le seuil des 13 000 dollars modifie le calcul économique pour les intégrateurs et les équipes qui souhaitent piloter l'humanoïde en environnement industriel. À titre de comparaison, le Unitree G1 reste l'une des rares références sous 20 000 dollars sur le marché mondial; les offres Figure 03, Agility Digit ou Boston Dynamics Electric Atlas se négocient bien au-delà. Si le T1 tient ses performances hors laboratoire, il pourrait abaisser la barrière d'entrée pour des secteurs à marges serrées comme la logistique légère ou l'assemblage à faible volume. Il convient cependant d'être prudent: Astribot liste des tâches réussies sans publier de métriques de cadence ni de données de robustesse en conditions industrielles réelles, et les vidéos de démonstration restent sélectionnées par l'entreprise. C'est une ouverture de commandes, pas un déploiement en volume documenté. Fondée en 2022 et basée à Shenzhen, Astribot s'est fait connaître à la World Robot Conference de Pékin en août 2024 avec le S1, humanoïde bimanuel de 170 cm et 90 kg aux 23 DOF (7 par bras, 4 pour le torse, 2 pour la tête, 3 pour la base omnidirectionnelle). Une publication arXiv de juillet 2025 détaillait la suite logicielle Astribot Suite, combinant collecte de données en réalité virtuelle, politiques d'imitation learning et optimisation de trajectoire en temps réel, avec des taux de réussite annoncés entre 80 et 100% sur tâches sélectionnées. La startup a levé environ 100 millions de dollars depuis 2024. Sur le segment prix du T1, les concurrents directs incluent le Unitree G1 et, dans une moindre mesure, les robots de recherche comme le GR00T N2 de NVIDIA. Aucun acteur européen ne se positionne encore clairement sur ce créneau accessible. La démonstration de robustesse en milieu non contrôlé et l'annonce de premiers clients industriels constitueront les prochaines étapes décisives pour valider l'ambition commerciale d'Astribot.

UELa démocratisation des prix sur ce segment pourrait inciter des intégrateurs européens à évaluer un pilote humanoïde, mais aucun déploiement ni partenariat européen n'est mentionné.

HumanoïdesOpinion
1 source
La Chine va attribuer des identifiants numériques aux robots humanoïdes pour suivre leur cycle de vie
173Robotics & Automation News 

La Chine va attribuer des identifiants numériques aux robots humanoïdes pour suivre leur cycle de vie

La Chine déploie un système national d'identification numérique pour les robots humanoïdes, selon une annonce relayée par la télévision d'État CCTV. Chaque robot se verra attribuer un numéro d'identité unique couvrant l'intégralité de son cycle de vie : fabrication, mise en service, déploiement opérationnel, jusqu'au recyclage et à la mise au rebut. L'objectif déclaré est de surveiller les risques de sécurité et de standardiser la gestion d'un parc en croissance rapide, sans que les autorités n'aient précisé à ce stade les modalités techniques du registre ni l'agence responsable de son opération. Pour les intégrateurs et les décideurs industriels, cette mesure signale un changement de maturité réglementaire : la Chine ne pilote plus seulement des déploiements expérimentaux, elle construit l'infrastructure de conformité nécessaire à un déploiement à l'échelle. La traçabilité lifecycle est un prérequis pour les marchés B2B exigeants (automobile, logistique, agroalimentaire), où la responsabilité produit et la maintenance prédictive sont des conditions d'achat. C'est aussi un levier de contrôle étatique sur une technologie jugée stratégique, capable d'imposer des standards de facto que les exportateurs devront respecter. Ce mouvement intervient alors que la Chine s'est positionnée comme le marché le plus actif du secteur humanoïde, avec des acteurs comme Unitree Robotics, UBTECH, Fourier Intelligence et AgiBot accumulant financements publics et commandes industrielles. Face aux concurrents américains Figure, Agility Robotics et Tesla Optimus, Pékin mise sur la standardisation réglementaire comme avantage compétitif systémique, une approche comparable à ce que l'UE tente via l'AI Act pour les systèmes logiciels.

UELa standardisation réglementaire chinoise sur les humanoïdes crée un précédent de facto qui pourrait imposer des contraintes de conformité aux exportateurs européens et renforcer l'urgence d'un cadre équivalent dans l'AI Act ou France 2030 Robotique.

Chine/AsieReglementation
1 source
Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état
174arXiv cs.RO 

Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état

Des chercheurs ont publié sur arXiv (référence 2605.25546) un framework hiérarchique de contrôle sécurisé corps entier pour robots humanoïdes, fondé sur les fonctions barrières robustes aux perturbations (ISSf-CBF, Input-to-State Safe Control Barrier Functions). L'architecture s'articule en trois couches : un contrôleur whole-body cinématique (KinWBC) qui génère des références articulaires à partir de tâches priorisées, un filtre ISSf-CBF qui les ajuste au minimum pour satisfaire les contraintes de sécurité sous perturbations bornées, et un contrôleur whole-body dynamique (DynWBC) qui garantit la faisabilité corps entier et la stabilité des contacts. Les contraintes couvertes incluent les limites articulaires, l'évitement d'auto-collision, l'évitement d'obstacles et les frontières du workspace. Validé en simulation et sur robot réel, le système a été testé dans trois scénarios : locomotion, téleopération et équilibre monopode avec contrôle simultané des mains. L'intérêt de l'approche tient à un problème fondamental en robotique humanoïde : les garanties de sécurité formelles s'effondrent dès qu'apparaît un écart entre le modèle de simulation et le comportement physique réel. Les CBFs classiques supposent un système parfaitement connu et deviennent fragiles face aux incertitudes de modèle, aux erreurs de suivi de trajectoire ou aux perturbations externes, précisément les conditions d'un environnement industriel. Les ISSf-CBFs étendent ce formalisme en admettant des perturbations bornées tout en maintenant des garanties formelles transférables du niveau cinématique vers la dynamique complète. Le filtre intervient de façon minimalement invasive, ne corrigeant les références nominales que lorsque nécessaire, ce qui préserve la performance globale. C'est une réponse directe au "demo-to-reality gap" structurellement reproché aux humanoïdes actuels, et un prérequis pour toute certification de robot collaboratif en environnement humain. Les Control Barrier Functions sont un outil bien établi en automatique, popularisé dans les années 2010 pour les véhicules autonomes et les bras robotiques. Leur extension aux ISSf-CBFs pour la robustesse aux perturbations est plus récente, et leur application à un humanoïde corps entier avec des dizaines de degrés de liberté, des contacts multiples et des dynamiques non linéaires représente un saut de complexité notable. Dans la course actuelle aux humanoïdes, les acteurs comme Figure, Boston Dynamics, Tesla (Optimus), Agility Robotics, Apptronik ou Unitree publient peu sur les garanties de sécurité formelles corps entier, un domaine resté majoritairement académique. Ce travail n'annonce pas de déploiement industriel, mais fournit une brique méthodologique directement applicable aux pipelines de validation et de certification des futurs robots collaboratifs.

UELes garanties de sécurité formelles apportées par ce framework sont directement pertinentes pour la certification des robots collaboratifs humanoïdes dans le cadre du Machinery Regulation et de l'AI Act européens.

RecherchePaper
1 source
La Chine attribue un identifiant numérique à chaque robot humanoïde pour renforcer les standards industriels
175SCMP Tech 

La Chine attribue un identifiant numérique à chaque robot humanoïde pour renforcer les standards industriels

La Chine a lancé vendredi le "Humanoid Full Lifecycle Management Service Platform", une initiative nationale visant à attribuer un identifiant numérique unique à chaque robot humanoïde fabriqué sur son territoire. Ces codes serviront à tracer les robots bipèdes dotés d'IA tout au long de leur cycle de vie, de la production jusqu'au déploiement opérationnel et à la maintenance. L'initiative s'inscrit dans un effort plus large de Pékin pour structurer un secteur en croissance rapide, en posant des bases réglementaires et des standards industriels communs. La décision est significative pour les intégrateurs et les acheteurs B2B : un système de traçabilité obligatoire implique une meilleure auditabilité des incidents, une gestion facilitée des responsabilités en cas de défaillance, et un registre centralisé permettant de surveiller les flottes déployées à l'échelle industrielle. Pour les décideurs, c'est un signal que la Chine passe d'une phase de course à la démo vers une maturité réglementaire, condition souvent nécessaire à l'adoption en environnement de production réel. C'est aussi un levier de différenciation compétitif : les fabricants chinois opérant dans un cadre normalisé auront plus facilement accès aux marchés industriels exigeants. La Chine compte aujourd'hui plusieurs acteurs humanoïdes de premier plan, dont Unitree Robotics (H1, G1), UBTECH (Walker S), Agibot et Fourier Intelligence, qui rivalisent avec des entreprises occidentales comme Figure AI (Figure 02), Physical Intelligence (pi0), et Tesla (Optimus Gen 2). L'instauration d'un registre national positionne Pékin comme précurseur en matière de gouvernance robotique, une dimension que ni l'Union Européenne ni les États-Unis n'ont encore formalisée à ce niveau de granularité. Les prochaines étapes pourraient inclure l'extension du dispositif aux robots mobiles industriels (AMR) et une interconnexion avec les systèmes de certification de sécurité fonctionnelle.

UELa Chine devance l'UE en instaurant un registre national obligatoire pour les robots humanoïdes, ce qui pourrait accélérer une réflexion réglementaire européenne dans le cadre de l'AI Act ou des initiatives France 2030 dédiées à la robotique.

Chine/AsieReglementation
1 source
Apprendre à évoluer : champs interactifs multimodaux pour la navigation humanoïde robuste en environnements dynamiques
176arXiv cs.RO 

Apprendre à évoluer : champs interactifs multimodaux pour la navigation humanoïde robuste en environnements dynamiques

Des chercheurs ont publié sur arXiv (2605.21935, mai 2026) un système de cartographie dynamique baptisé MIF (Multi-modal Interactive Field), conçu pour permettre aux robots humanoïdes de naviguer et de manipuler des objets dans des environnements réels en constante évolution. Testé sur un Unitree G1, le système améliore le taux de relocalisation dans un bureau non-statique de 12 % à 94 %, tout en réduisant l'empreinte mémoire sémantique de 91,4 % grâce à la distillation de features. MIF repose sur trois composantes couplées : un champ d'apparence basé sur le 3D Gaussian Splatting (3DGS) conscient de l'incertitude pour atténuer le flou induit par la marche bipède, un champ spatial maintenant une mémoire topologique de la scène, et un champ géométrique qui calcule une pose d'interaction sûre (Interaction Pose Safety, IPS) avant chaque manipulation. Un score de détection de discordance distingue les fausses alarmes dues aux oscillations du robot des changements persistants réels, et ne met à jour que les zones localement incohérentes. L'enjeu pratique est direct : les systèmes de cartographie sémantique existants (semantic maps, scene graphs) supposent généralement des trajectoires caméra stables et des environnements statiques, deux hypothèses qu'un humanoïde en mouvement viole en permanence. Passer de 12 % à 94 % de succès en relocalisation sur un robot réel dans un bureau avec personnes en mouvement constitue un résultat concret, pas une démo en laboratoire contrôlé. Pour un intégrateur ou un COO industriel évaluant des humanoïdes pour des tâches de pick-and-place, la capacité à maintenir une carte cohérente sous perturbation locomotrice est un prérequis opérationnel non négociable que la plupart des démos actuelles ne valident pas. Le contexte de ce travail s'inscrit dans l'essor du 3DGS comme alternative aux NeRF pour la représentation de scènes en temps réel, une technique popularisée en 2023 et dont l'adaptation à la robotique mobile reste un sujet de recherche actif. L'Unitree G1 est l'une des plateformes humanoïdes commerciales les plus accessibles du marché (autour de 16 000 dollars), ce qui rend ce type de validation plus reproductible que sur des robots propriétaires comme l'Atlas de Boston Dynamics ou le Figure 02. Le code et la page projet sont publiés (ziya-jiang.github.io/MIF-homepage), signal d'une recherche ouverte à la reproduction. Les prochaines étapes naturelles seraient une validation à plus grande échelle et une intégration dans des pipelines de manipulation end-to-end, terrain sur lequel Physical Intelligence (Pi-0) et les équipes GR00T de NVIDIA travaillent en parallèle.

HumanoïdesPaper
1 source
WestWorld : un modèle du monde de trajectoires évolutif intégrant des connaissances pour systèmes robotiques variés
177arXiv cs.RO 

WestWorld : un modèle du monde de trajectoires évolutif intégrant des connaissances pour systèmes robotiques variés

Une équipe de chercheurs a publié WestWorld (arXiv:2603.14392), un modèle de monde trajectoire conçu pour opérer sur des systèmes robotiques hétérogènes. Préentraîné sur 89 environnements complexes couvrant une large variété de morphologies en simulation et en conditions réelles, le modèle cible deux lacunes récurrentes dans la littérature : la difficulté de passer à l'échelle face à un grand nombre de dynamiques système distinctes, et l'absence d'intégration des connaissances sur les structures physiques des robots. La validation réelle a été conduite sur un quadrupède Unitree Go1, où WestWorld a démontré des performances stables en locomotion. Le code source est disponible sur GitHub. L'architecture repose sur un mécanisme baptisé Sys-MoE (system-aware Mixture-of-Experts), qui route dynamiquement des experts spécialisés selon le système robotique fourni en entrée, via un embedding système appris. Un embedding structurel complémentaire aligne les représentations de trajectoires avec les informations morphologiques du robot, permettant au modèle de tenir compte du fait qu'un bras articulé, un quadrupède et une plateforme mobile n'obéissent pas aux mêmes contraintes physiques. Les résultats affichent des gains significatifs en prédiction de trajectoire zero-shot et few-shot face aux baselines compétitives, ainsi qu'une amélioration des performances sur le contrôle model-based downstream pour différentes plateformes robotiques. La scalabilité tient sur un spectre large d'environnements, ce qui constitue l'argument central de la contribution. La publication s'inscrit dans une tendance forte : appliquer aux robots les world models issus du monde des agents RL et des LLMs multimodaux, à l'image de Dreamer, UniSim, ou des frameworks VLA (Vision-Language-Action) orientés manipulation. WestWorld se distingue par son ambition généraliste multi-morphologie, là où la majorité des approches concurrentes restent spécialisées sur une famille de robots. L'usage du Unitree Go1 comme banc de test réel est pertinent mais reste un cas relativement balisé dans la littérature, ce qui nuance la portée de la démonstration sim-to-real. Les prochaines étapes logiques seront d'évaluer le transfert sur des morphologies plus complexes, humanoïdes notamment, là où les défis de généralisation sont encore ouverts.

RecherchePaper
1 source
Sélectionner ou ne pas sélectionner : distillation de la prédiction de compétences robotiques en petit ensemble
178arXiv cs.RO 

Sélectionner ou ne pas sélectionner : distillation de la prédiction de compétences robotiques en petit ensemble

Une équipe de chercheurs publie en mai 2026 un preprint (arXiv:2605.21242) portant sur la prédiction automatique de compétences robotiques dans les flottes hétérogènes. À partir d'une description de tâche en langage naturel, le système identifie quelles capacités physiques sont requises parmi six catégories: vol, roues, pattes, navigation en surface aquatique, navigation sous-marine et manipulation avec mains. Faute de données labellisées existantes pour ce mapping, les auteurs ont construit un dataset synthétique via génération assistée par LLM et audit ciblé des étiquettes. Un ensemble de deux encodeurs de phrases fine-tunés (mpnet + MiniLM, environ 133 millions de paramètres au total) atteint 83,5 % de précision sur un jeu de test stratifié de 200 tâches, dépassant Kimi K2 (1 000 milliards de paramètres, architecture MoE) à 72,0 %, GPT-OSS-120B à 71,5 %, et Llama-4-Scout-17B à 69,0 %, tous évalués en zero-shot avec le même prompt. Ce résultat expose une asymétrie opérationnelle significative: un modèle de 133 millions de paramètres déployable localement surclasse des LLMs un millier de fois plus volumineux sur une tâche de routage de flotte. Pour les intégrateurs gérant des flottes mixtes (humanoïdes, quadrupèdes, drones, rovers), l'assignation automatique de la bonne plateforme à la bonne tâche reste un problème non résolu en production. Une limite mérite d'être soulignée: le jeu d'évaluation de 200 tâches synthétiques a été produit par les auteurs eux-mêmes, ce qui appelle une validation indépendante sur des scénarios réels avant de tirer des conclusions définitives. La gestion de flottes robotiques hétérogènes s'est intensifiée avec la multiplication des plateformes commerciales (Boston Dynamics Spot, Unitree B2, humanoïdes Figure ou Agility Digit, drones industriels), et les approches actuelles de routage reposent encore sur des règles manuelles peu scalables. Les auteurs s'inscrivent dans la tendance de distillation de capacités LLM vers des modèles compacts (famille SetFit, sentence-transformers), appliquée ici pour la première fois à la sélection de plateforme robotique. Ce preprint ne mentionne ni déploiement terrain ni partenariat industriel, mais l'utilisation de mpnet et MiniLM, disponibles en open-source sur Hugging Face, abaisse la barrière à une validation industrielle rapide.

RecherchePaper
1 source
Amélioration du SLAM par graphes en environnement sans GNSS grâce à l'odométrie des jambes
179arXiv cs.RO 

Amélioration du SLAM par graphes en environnement sans GNSS grâce à l'odométrie des jambes

Des chercheurs ont publié sur arXiv (2605.20484) une architecture de graphe de facteurs qui améliore significativement la précision verticale du SLAM LiDAR-inertiel pour robots à pattes en environnement sans GNSS. Le système augmente le framework LIO-SAM avec une voie cinématique parallèle, alimentée par l'odométrie proprioceptive des jambes, couplée à la voie LiDAR-inertielle principale via une contrainte de pose relative avec modèle de bruit sélectif. Testé sur un quadrupède Linxai D50 lors de deux boucles extérieures totalisant plus d'un kilomètre, l'approche réduit la dérive en élévation de plus de 30 mètres à moins de 30 centimètres, soit une réduction de deux ordres de grandeur. Sur un scénario où le pipeline de référence échoue complètement à converger, la méthode proposée maintient la localisation. Ce résultat est significatif parce qu'il exploite une source de données déjà disponible à bord, calculée pour le contrôle de la locomotion, sans capteur supplémentaire. Le problème de la dérive verticale du LiDAR est bien documenté dans les environnements géométriquement pauvres ou répétitifs (couloirs, forêts, parkings), où les points de correspondance sont insuffisants pour contraindre l'axe Z. Utiliser l'odométrie des pattes comme ancre verticale légère est une approche pragmatique : elle s'insère dans les pipelines existants sans reconfiguration hardware, ce qui en facilite le déploiement sur des plateformes commerciales comme Unitree, Boston Dynamics Spot, ou ANYmal. Pour les intégrateurs et les équipes déployant des robots en inspection industrielle ou en environnements souterrains, c'est une piste concrète pour améliorer la robustesse SLAM sans surcoût matériel. LIO-SAM est un framework SLAM LiDAR-inertiel développé par Ji Zhang et Sanjiv Singh (Carnegie Mellon), largement adopté dans la communauté robotique depuis 2020, notamment pour les robots terrestres et aériens. Le couplage proprioception-SLAM n'est pas nouveau en théorie, mais son intégration efficace dans un graphe de facteurs en conditions réelles reste un sujet actif. Côté concurrence, les approches actuelles s'appuient généralement sur la fusion IMU renforcée (LOAM, LEGO-LOAM) ou l'ajout de capteurs barométriques pour corriger la dérive verticale. La prochaine étape naturelle serait de tester l'approche sur des terrains avec dénivelé marqué, et d'évaluer la robustesse face aux glissements de pattes, cas limite non abordé dans cette version préliminaire.

RecherchePaper
1 source
Une entreprise chinoise accélère l'intelligence des robots humanoïdes avec un contrôle à 300 FPS
180Interesting Engineering 

Une entreprise chinoise accélère l'intelligence des robots humanoïdes avec un contrôle à 300 FPS

Horizon Robotics, entreprise chinoise connue jusqu'ici pour ses SoC dédiés à l'IA embarquée dans l'automobile, a publié en open source HoloMotion-1, un modèle de contrôle moteur corps entier pour robots humanoïdes. Fort de 4 milliards de paramètres, ce modèle dépasse d'un à deux ordres de grandeur les architectures cérébelleuses habituellement déployées, qui plafonnent à quelques millions de paramètres. En inférence, HoloMotion-1 atteint 200 à 300 cycles par seconde sur calculateur embarqué, le module moteur physique tournant en parallèle à 50 Hz pour lisser les trajectoires. La démonstration a été conduite sur un robot Unitree G1, en zero-shot complet : aucun fine-tuning sur données réelles, toute l'inférence exécutée en local. Le robot a reproduit des comportements absents de son entraînement physique, notamment la danse, le rampé, la position assise et des frappes de type arts martiaux. Des tests de téléopération en temps réel via combinaison de capture de mouvement et contrôleurs VR ont également montré un suivi stable des gestes humains. Le point critique n'est pas la vitesse brute mais la robustesse du sim-to-real gap sans adaptation. Réussir un transfert zero-shot sur un humanoïde commercial reste un obstacle mal résolu par la majorité des systèmes actuels, qui exigent des phases de fine-tuning coûteuses. HoloMotion-1 contourne partiellement ce problème en constituant un corpus de données radicalement plus large : données MoCap sélectionnées, données internes, et mouvements reconstruits depuis des vidéos du monde réel, augmentant la couverture des situations imprévues. L'architecture MoE (Mixture-of-Experts) Transformer active sélectivement des sous-réseaux spécialisés à chaque pas de temps, réduisant le coût computationnel sans régresser sur la capacité expressive. Le KV-cache accélère l'inférence séquentielle en réutilisant les calculs passés. L'entraînement repose sur une méthode PPO (Proximal Policy Optimization) appliquée à des séquences de mouvement complètes plutôt qu'à des pas de temps isolés, ce qui améliore la stabilité sur corpus hétérogène. Pour un intégrateur ou un OEM robotique, la conséquence concrète est qu'un modèle généraliste à 4 milliards de paramètres devient déployable sur edge hardware sans infrastructure cloud. Il convient toutefois de souligner que les démonstrations publiées restent des séquences sélectionnées, sans métriques indépendantes sur la robustesse en conditions industrielles. Horizon Robotics est historiquement positionnée sur la couche silicium, avec ses puces Journey pour l'ADAS, et HoloMotion-1 marque un pivot vers la couche logicielle en robotique humanoïde. Le choix de l'open source suit la stratégie d'influence sur l'écosystème pratiquée par Meta avec LLaMA dans les LLM : imposer un standard de fait avant que les concurrents ne verrouillent leur stack propriétaire. Le paysage concurrentiel est dense : Physical Intelligence (Pi-0), NVIDIA (GR00T N2), Agility Robotics et Figure AI côté occidental, Unitree, Fourier Intelligence et Zhiyuan Robotics côté chinois. La publication décrit un plan en quatre phases pour le contrôle humanoïde ("Imitate Any Pose, Follow Any Command" en constituent les deux premières), mais les phases suivantes n'ont pas été détaillées publiquement. Aucun déploiement industriel ni partenariat de production n'est annoncé à ce stade.

UELa publication open-source de HoloMotion-1 met à disposition des équipes R&D européennes un modèle de contrôle moteur corps entier déployable sur edge hardware, mais aucun acteur, labo ou déploiement européen n'est impliqué.

IA physiqueOpinion
1 source
La robotique connaîtra-t-elle son moment ChatGPT ?
181IEEE Spectrum Robotics 

La robotique connaîtra-t-elle son moment ChatGPT ?

En 2025, les investissements dans les entreprises de robotique ont atteint un record de 40,7 milliards de dollars, soit 9 % de l'ensemble du capital-risque mondial. C'est dans ce contexte que Jonathan Hurst, professeur en robotique à l'Oregon State University et cofondateur d'Agility Robotics, et Wendy Tan White, ancienne CEO du projet Everyday Robots chez Google X, publient une analyse à contre-courant. Leur thèse : la robotique ne connaîtra pas de "moment ChatGPT" unique, mais progressera grâce à l'application coordonnée de plusieurs systèmes d'IA complémentaires. Ils articulent leur démonstration autour de cinq vérités difficiles, dont la première est le "YouTube-to-Reality Gap". La prestation des robots humanoïdes Unitree au gala du Nouvel An chinois 2026, où des machines exécutaient des figures d'arts martiaux avec des enfants, illustre parfaitement ce fossé : techniquement impressionnante, la séquence était entièrement chorégraphiée, relevant du même niveau d'autonomie qu'un bras industriel en usine automobile, et non d'un système capable de s'adapter à l'imprévu. L'enjeu est décisif pour les intégrateurs et décideurs industriels. Si les robots maîtrisent le backflip et le kung-fu, pourquoi sont-ils absents des chaînes de production généralistes et des cuisines domestiques ? L'IA mobilisée dans ces démonstrations ne sert que le contrôle moteur de bas niveau, sans capacité de raisonnement ni d'adaptation à des environnements non structurés. La rupture introduite par l'IA est réelle : les robots apprennent désormais au lieu d'être programmés, et peuvent, avec suffisamment de données, percevoir, raisonner et agir de façon fiable. Mais ce saut exige des systèmes d'IA coordonnés et rigoureusement intégrés, et non un modèle fondateur unique. La promesse de robots polyvalents vivant aux côtés des humains alimente la science-fiction depuis des décennies, et les déceptions accumulées ont rendu le secteur prudent face aux annonces. Agility Robotics déploie son humanoïde Digit dans des entrepôts Amazon depuis 2023, l'une des rares preuves de déploiement industriel réel à l'échelle. La concurrence s'est toutefois densifiée : Figure AI, Tesla Optimus, 1X et Apptronik côté produits, Physical Intelligence (Pi-0) et NVIDIA (GR00T N2) côté recherche. Hurst et White, forts d'une décennie de terrain, ne disqualifient pas l'optimisme ambiant, mais rappellent l'obligation de distinguer ce qui est opérationnel de ce qui reste un prototype filmé sous son meilleur angle.

HumanoïdesOpinion
1 source
PRIME : estimation inertielle et de mouvement physiquement cohérente pour robots à pattes et humanoïdes
182arXiv cs.RO 

PRIME : estimation inertielle et de mouvement physiquement cohérente pour robots à pattes et humanoïdes

Une équipe de chercheurs a présenté PRIME (Physically-consistent Robotic Inertial and Motion Estimation), une méthode d'estimation de mouvement pour robots à pattes et humanoïdes publiée sur arXiv en mai 2026 (arXiv:2605.17681). Là où les pipelines conventionnels basés sur des filtres de Kalman étendus (EKF) ou la capture de mouvement externe ne reconstruisent que la cinématique, PRIME formule le problème comme une estimation MAP (Maximum A Posteriori) qui raffine simultanément les données proprioceptives brutes et les commandes des actionneurs pour produire une trajectoire dynamiquement cohérente. L'algorithme estime conjointement les forces de contact frictionnelles et les paramètres inertiels du robot (masses, centres de masse, moments d'inertie), via une modélisation différentiable de la dynamique de contact avec contraintes de complémentarité lissées et un modèle de friction d'Anitescu. Les validations ont été conduites sur des robots quadrupèdes et sur l'humanoïde Unitree G1, lors de séquences de locomotion à contacts multiples en déploiement réel. Le problème abordé est structurel : les pipelines de perception robotique actuels ignorent les forces de contact et les paramètres inertiels effectifs du système, ce qui entraîne des reconstructions qui violent régulièrement la dynamique des corps rigides, en particulier lors des phases de contact. Cette incohérence dégrade la qualité des données d'entraînement et limite la robustesse des contrôleurs en boucle fermée. PRIME produit des reconstructions de mouvement annotées en forces et contacts directement depuis des robots en déploiement terrain, sans infrastructure de laboratoire. Pour les équipes qui développent des modèles de fondation robotiques ou des architectures Visual-Language-Action (VLA), cette capacité représente une source de données haute qualité exploitable à grande échelle, là où la rareté d'annotations dynamiques fiables reste un goulot d'étranglement reconnu. L'estimation d'état pour robots à pattes est un problème ancien, historiquement traité par EKF couplés à la proprioception, la capture de mouvement restant cantonnée aux laboratoires. PRIME se distingue en proposant une solution embarquée et déployable en conditions réelles, sans dépendance à une infrastructure externe. L'humanoïde Unitree G1, commercialisé autour de 16 000 dollars et très présent dans la recherche académique mondiale, sert de banc de validation représentatif. Dans un contexte où Boston Dynamics, Figure AI, Agility Robotics, 1X et Unitree accumulent des données de déploiement pour alimenter leurs pipelines d'apprentissage, PRIME propose une brique méthodologique transversale pour enrichir ces corpus avec des annotations dynamiques fiables. Les applications naturelles incluent l'imitation learning, le transfert sim-to-real et l'entraînement de modèles de fondation à partir de données terrain.

UELes équipes de recherche européennes en locomotion robotique (INRIA, LAAS-CNRS) pourraient exploiter PRIME pour enrichir leurs pipelines d'entraînement sans infrastructure de laboratoire, mais aucun acteur ou institution européen n'est directement impliqué.

RecherchePaper
1 source
Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions
183arXiv cs.RO 

Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions

Des chercheurs ont publié sur arXiv (réf. 2602.08167, version 2) la méthode R&B-EnCoRe, conçue pour améliorer le raisonnement des modèles Vision-Language-Action (VLA) en robotique sans annotation humaine ni récompense externe. Sur des tâches de manipulation avec bras Franka Panda en simulation et WidowX sur matériel réel, et de navigation sur quatre types de plateformes (bipèdes, wheeled, vélo et quadrupède), la méthode affiche 28 % de gain sur le taux de succès en manipulation, 101 % d'amélioration sur les scores de navigation, et 21 % de réduction du taux de collision par rapport aux baselines VLA traitant indistinctement tous les primitives de raisonnement disponibles. Les tests couvrent des architectures de 1B à 30B paramètres et incluent un volet conduite autonome ; aucun déploiement industriel ni partenaire commercial n'est mentionné, il s'agit d'une contribution de recherche fondamentale. Le problème ciblé est structurel dans le domaine VLA : les approches actuelles de raisonnement "chain-of-thought" incarné (Embodied CoT) imposent des templates rigides qui listent objets visibles, plans de haut niveau et affordances de scène, quelle que soit leur pertinence pour l'action à exécuter. Ce bruit informationnel nuit à la prédiction d'action et fragilise la politique de contrôle. R&B-EnCoRe modélise le raisonnement comme une variable latente dans un cadre d'inférence variationnelle pondérée par importance, permettant au modèle de générer et distiller automatiquement des raisonnements filtrés par leur capacité à prédire une action réussie. Ce mécanisme améliore le transfert des connaissances internet vers l'exécution physique réelle, problème central du "grounding" en robotique incarnée. Les VLA à raisonnement incarné forment un sous-domaine actif depuis les travaux π0 de Physical Intelligence, OpenVLA d'UC Berkeley et RT-2 de Google DeepMind. R&B-EnCoRe se positionne comme un raffinement post-entraînement applicable à des architectures existantes plutôt que comme un nouveau modèle de fondation. La validation sur cinq catégories d'embodiments distincts est plus large que la majorité des contributions VLA, qui restent limitées à la manipulation. Aucune suite commerciale n'est annoncée, mais l'approche est directement compatible avec des plateformes comme Unitree, Boston Dynamics Spot ou Franka Production 3, ainsi qu'avec les benchmarks standardisés LIBERO et BRS.

IA physiqueOpinion
1 source
Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée
184Interesting Engineering 

Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée

Menlo Research, une startup basée à Singapour, a lancé un kit de construction pour son robot humanoïde open-source Asimov, vendu environ 15 000 dollars, soit un prix proche du coût réel de ses composants selon la liste publiée sur GitHub. Le robot mesure 1,20 mètre, pèse 35 kilogrammes et dispose de plus de 25 degrés de liberté. Livré entièrement démonté, avec manuels et vidéos de montage, il cible chercheurs, développeurs et hobbyistes avancés. L'architecture est entièrement modulaire : jambes, bras, torse et tête s'interconnectent via des fixations moteur universelles, permettant le remplacement ou la mise à niveau de composants sans refonte globale. La cheville utilise un mécanisme parallèle RSU (Revolute-Spherical-Universal) à deux degrés de liberté (roulis et tangage), améliorant la distribution du couple sur terrain irrégulier. Les orteils sont passifs (non actionnés), simplifiant la transition appui-poussée et réduisant la charge calculatoire. Les pièces structurelles sont optimisées pour l'impression 3D Multi Jet Fusion (MJF), éliminant le recours à l'usinage CNC coûteux. Côté logiciel, l'entraînement repose sur une approche "Processor-in-the-Loop" (PIL) qui injecte délibérément des imperfections réalistes : latences CANBus simulées jusqu'à 9 millisecondes et bruit de capteurs via une couche d'émulation I2C. Un framework Asymmetric Actor-Critic sépare le "critic" (accès aux données de simulation exactes) de l'"actor" (signaux bruités et retardés comme en conditions matérielles réelles), aboutissant à un transfert sim-to-real en zéro-shot : marche avant et arrière, récupération après poussées externes, sans calibration supplémentaire sur le robot physique. Ce positionnement tarifaire est notable dans un secteur où les plateformes humanoïdes commerciales de référence restent fermées ou inaccessibles aux équipes indépendantes. Le zero-shot sim-to-real représente l'un des verrous historiques de la locomotion humanoïde ; l'approche PIL, qui force le modèle à apprendre sous latence et bruit réalistes dès la phase simulation, constitue une réponse directe au problème classique du sim-to-real gap que rencontrent des projets comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA lors du passage à l'échelle. Pour un laboratoire de recherche ou un intégrateur, cela représente un cycle de développement potentiellement plus court entre simulation et déploiement terrain, sans nécessiter de fine-tuning sur matériel physique coûteux. Menlo Research s'inscrit dans la tendance d'open-sourcing de la robotique humanoïde, aux côtés de l'Open Dynamic Robot Initiative et du Unitree H1 (environ 20 000 dollars, firmware partiellement ouvert). Asimov ne rivalise pas directement avec Figure 03, Tesla Optimus Gen 3 ou Agility Digit pour les déploiements industriels à grande échelle : il cible le segment recherche et éducation, aujourd'hui peu couvert par des plateformes réellement capables de locomotion autonome. La publication du bill-of-materials complet sur GitHub renforce la crédibilité de la démarche, même si 15 000 dollars reste hors portée du grand public et que les performances annoncées n'ont pas encore été validées de manière indépendante. Les prochaines étapes annoncées portent sur l'amélioration de la stack logicielle et l'élargissement de la communauté open-source autour du projet.

HumanoïdesActu
1 source
frax : cinématique et dynamique robotique rapide en JAX
185arXiv cs.RO 

frax : cinématique et dynamique robotique rapide en JAX

Une équipe de chercheurs a publié frax, une bibliothèque open-source de cinématique et dynamique de corps rigides pour la robotique, construite sur JAX, le framework d'autodifférenciation de Google. Documentée dans l'article arXiv:2604.04310, la librairie cible une lacune précise : la plupart des bibliothèques existantes excellent soit en exécution CPU à faible latence, soit en débit GPU massif, mais rarement les deux à la fois. frax propose une interface unifiée en Python pur, opérationnelle sur CPU, GPU et TPU sans modification de code. Sur CPU, les temps de calcul descendent à quelques microsecondes, compatibles avec des boucles de contrôle à l'échelle du kilohertz, à parité avec des implémentations C++ optimisées. Sur GPU, la même implémentation vectorisée atteint plus de 100 millions d'évaluations de dynamique par seconde en parallélisant des milliers d'instances simultanément. Les performances ont été validées sur deux plateformes de référence : le bras manipulateur Franka Panda et l'humanoïde Unitree G1. L'impact pour les équipes de robotique est double. Le support natif de l'autodifférenciation via JAX ouvre la voie à des méthodes d'optimisation basées sur les gradients directement dans la boucle de simulation, ce qui accélère le model-based reinforcement learning et le trajectory optimization sans nécessiter d'implémentations séparées. Le fait d'atteindre des temps de cycle CPU comparables au C++ depuis un code Python pur représente également un gain de friction considérable pour les intégrateurs, entre le stade prototype et le déploiement. La scalabilité GPU à 100 millions d'évaluations par seconde est particulièrement pertinente pour le sim-to-real, où l'entraînement massif en simulation parallèle est devenu la norme dans les pipelines de robot learning modernes. frax s'inscrit dans un écosystème JAX en expansion pour la robotique, aux côtés de Brax (Google DeepMind) et MuJoCo XLA (mjx). Les auteurs ne prétendent pas remplacer ces outils, mais proposer une alternative axée sur la polyvalence multi-matériel et la simplicité d'usage. La bibliothèque C++ Pinocchio, développée par le Gepetto team du LAAS-CNRS à Toulouse en partenariat avec l'INRIA, reste une référence pour les systèmes embarqués temps réel, mais frax vise explicitement le segment recherche et apprentissage. La bibliothèque est disponible en open-source, et les prochaines étapes attendues incluent l'intégration avec des pipelines RL existants et l'extension à la dynamique de contact.

UEfrax s'inscrit dans l'écosystème des outils de simulation robotique aux côtés de Pinocchio (LAAS-CNRS/INRIA, Toulouse), et pourrait accélérer les pipelines de robot learning dans les laboratoires français et européens travaillant sur le sim-to-real.

RecherchePaper
1 source
Asimov : un robot humanoïde open source accessible à tous
186Hackaday Robots Hacks 

Asimov : un robot humanoïde open source accessible à tous

Le projet Asimov v1 est un robot humanoïde open source en kit, proposé à un prix cible de 15 000 dollars, avec la nomenclature complète publiée sur GitHub pour permettre aux équipes de sourcer leurs propres composants. Doté de 25 degrés de liberté au total, il embarque un calculateur basé sur un Raspberry Pi 5 et un module Radxa CM5, deux références grand public faciles à approvisionner. Les performances physiques déclarées restent modestes : 5 kg en squat et 18 kg en tirage unilatéral à un bras, ce qui le positionne clairement dans la catégorie expérimentale. Tout le code est libre, laissant aux développeurs la latitude d'implémenter leurs propres couches de contrôle. À 15 000 dollars avec du matériel sur étagère, Asimov v1 représente une rupture de prix notable dans un secteur longtemps réservé aux géants industriels. Les démonstrations emblématiques de Honda (Asimo, programme lancé dans les années 1980) et les investissements massifs de Tesla pour Optimus ont durablement ancré l'image d'un marché inaccessible aux laboratoires ou aux startups. L'open source change la donne : une équipe universitaire ou un intégrateur peut désormais disposer d'une base matérielle documentée pour tester des modèles de contrôle visuomoteur ou des politiques d'apprentissage par renforcement sans dépendre d'un fournisseur propriétaire. Il convient toutefois de rester prudent sur les métriques publiées, présentées sans protocole de test standardisé et sans vidéo en conditions réelles. Asimov v1 s'inscrit dans une tendance de démocratisation du hardware robotique comparable à ce que l'open source a réalisé dans les drones avec ArduPilot ou PX4 dans les années 2010. Sur le segment accessible, il se distingue du Unitree G1 (environ 16 000 dollars, non open source) par sa transparence architecturale complète. Il reste très éloigné des plateformes industrielles comme Figure 03, Agility Robotics Digit ou Apptronik Apollo, qui ciblent la logistique avec des financements de plusieurs centaines de millions de dollars et des déploiements confirmés chez des partenaires industriels. Fédérer une communauté active de contributeurs sera la prochaine étape critique pour faire progresser les performances mécaniques et logicielles du projet.

UELes laboratoires universitaires et startups robotique français et européens disposent d'une base matérielle open source documentée à 15 000 $ pour prototyper des algorithmes de contrôle visuomoteur sans dépendre d'un fournisseur propriétaire.

HumanoïdesOpinion
1 source
DeepCybo : une startup pékinoise mise sur les données humaines en première personne pour développer une AGI incarnée
187Pandaily 

DeepCybo : une startup pékinoise mise sur les données humaines en première personne pour développer une AGI incarnée

DeepCybo, startup pékinoise fondée début 2025 par Chen Kai, parie sur la vidéo humaine à la première personne comme substrat d'entraînement pour l'intelligence incarnée (embodied AGI). L'approche consiste à collecter des flux vidéo authentiques captés du point de vue d'opérateurs humains, plutôt que de s'appuyer sur la simulation ou les démonstrations téléopérées. La société a levé plusieurs centaines de millions de RMB et accélère actuellement sa collecte de données pour valider l'approche à l'échelle. Pendant ce temps, le marché mondial a convergé vers une thèse similaire : en mai 2025, Tesla a annoncé réorienter l'entraînement d'Optimus vers des données vidéo humaines ; en juin 2025, GeneralistAI a présenté un système d'apprentissage imitatif validé par 270 000 heures de données collectées en conditions réelles. FigureAI a annoncé des partenariats avec des groupes immobiliers commerciaux pour instrumenter des opérateurs humains. En février 2026, NVIDIA a publié EgoScale, un modèle pré-entraîné sur 20 000 heures de vidéo egocentriques pour la manipulation dextère. La convergence de ces annonces en moins d'un an pointe vers une même conclusion : le sim-to-real gap reste difficile à combler via la simulation seule, et les données synthétiques ne généralisent pas suffisamment aux environnements non structurés. Pour les intégrateurs industriels et les équipes R&D, cela redéfinit l'actif stratégique central : la volumétrie et la qualité des données egocentriques comptent autant que l'architecture du modèle. La course à l'embodied AI ne se joue plus uniquement sur les paramètres du réseau, mais sur la capacité à instrumenter des humains à grande échelle, ce qui soulève des questions pratiques de coût de collecte, d'annotation et de diversité des scénarios. DeepCybo évolue dans un écosystème chinois de la robotique humanoïde très compétitif, face à des acteurs comme Unitree, Agibot ou Zhiyuan Robotics, mais avec un positionnement centré sur l'IA plutôt que sur le hardware. À noter que l'article source utilise indifféremment les noms "DeepCybo" et "DeepMotor" sans distinction claire, ce qui suggère soit un changement de nom récent, soit une imprécision éditoriale. La principale inconnue reste le transfert effectif entre données humaines et performance robotique réelle en production : ni GeneralistAI ni NVIDIA n'ont encore démontré ce gap comblé à l'échelle commerciale, et DeepCybo, malgré une levée conséquente, n'a pas publié de résultats quantitatifs indépendants à ce stade.

Chine/AsieOpinion
1 source
DeepMotor : une startup de Pékin mise sur les données en première personne pour une IA incarnée générale
188Pandaily 

DeepMotor : une startup de Pékin mise sur les données en première personne pour une IA incarnée générale

DeepMotor, une startup pékinoise fondée par Chen Kai au début 2025, développe une approche d'intelligence artificielle incarnée (embodied AGI) basée sur l'entraînement à partir de vidéos en première personne capturées par des humains. Au lancement, la thèse de l'entreprise n'a convaincu ni les investisseurs domestiques ni la majorité du secteur : pourquoi parier sur une méthode que même les géants américains n'avaient pas encore validée ? La startup a levé plusieurs centaines de millions de RMB et poursuit aujourd'hui un déploiement accéléré. La chronologie des validations industrielles donne la mesure de son avance : en mai 2025, Tesla a annoncé réorienter l'entraînement d'Optimus vers des données vidéo humaines. En juin 2025, GeneralistAI a présenté une démo d'apprentissage imitatif robotique, puis a confirmé les lois de mise à l'échelle avec 270 000 heures de données humaines réelles collectées sur le terrain. FigureAI a de son côté annoncé des partenariats avec des opérateurs immobiliers commerciaux pour collecter des flux en première personne. En février 2026, NVIDIA a publié EgoScale, un modèle pré-entraîné sur 20 000 heures de vidéo première personne destiné à la manipulation dextre. L'importance de cette séquence dépasse le simple calendrier. Elle valide l'hypothèse centrale de DeepMotor : la vidéo en vue égocentrique est le signal d'apprentissage le plus dense pour combler le sim-to-real gap en robotique généraliste. Chaque acteur majeur converge vers cette approche non par choix idéologique, mais parce que les benchmarks internes le forcent. Pour les intégrateurs industriels et les décideurs B2B, cela signifie que la prochaine génération de robots manipulateurs ne sera pas entraînée dans des simulateurs mais sur des flux de travail humains réels, ce qui redéfinit les exigences en matière de collecte de données et de gouvernance des contenus vidéo. DeepMotor s'inscrit dans un écosystème robotique chinois en forte accélération, concurrent direct d'Unitree, d'Agibot et des branches robotique de Baidu et Tencent, mais avec une orientation plus fondamentale sur la couche de données brutes plutôt que sur le hardware. La startup a devancé d'environ un an le consensus industriel mondial sur l'approche egocentric data, ce qui lui confère une position de référence potentielle si elle parvient à publier ses propres scaling laws ou à ouvrir un dataset. Les prochaines étapes probables incluent la publication de résultats comparatifs et des partenariats avec des fabricants de robots humanoides pour valider le transfert de politique sur des plateformes tiers. La source originale (Waves/暗涌) reste un media chinois spécialisé, et les chiffres de levée ne sont pas précisément détaillés.

UELe basculement de l'industrie vers les données vidéo égocentristes comme signal d'entraînement de référence redéfinira les exigences de collecte de données et de gouvernance vidéo pour les intégrateurs et fabricants de robots européens, sans acteur français ou européen directement impliqué à ce stade.

Chine/AsieOpinion
1 source
VEGA : alignement par ancrage de l'encodeur visuel pour les modèles VLA à conscience spatiale
189arXiv cs.RO 

VEGA : alignement par ancrage de l'encodeur visuel pour les modèles VLA à conscience spatiale

Des chercheurs proposent VEGA (Visual Encoder Grounding Alignment), publié sur arXiv (2605.10485) en mai 2026, un cadre d'alignement destiné à corriger un défaut structurel des modèles vision-langage-action (VLA) : leurs encodeurs visuels, préentraînés sur des images 2D, manquent de perception géométrique 3D. VEGA aligne la sortie de l'encodeur visuel du VLA directement avec les features spatiales de DINOv2-FiT3D, une variante de DINOv2 (Meta) affinée via supervision par 3D Gaussian Splatting multi-vues. L'alignement repose sur un projecteur léger entraîné par perte cosinus en parallèle de la prédiction d'action standard, puis éliminé à l'inférence pour ne pas alourdir le runtime. Sur benchmarks de simulation et tâches réelles de manipulation, VEGA établit un nouvel état de l'art parmi les méthodes d'ancrage spatial implicite. L'enjeu opérationnel est direct : la manipulation fine exige une compréhension géométrique de la scène, pas uniquement sémantique. Les approches existantes alignaient déjà les VLA avec des modèles 3D-aware, mais au niveau des tokens LLM, là où spatial et linguistique sont déjà mélangés, limitant la généralisation. En remontant l'alignement à l'encodeur visuel, VEGA évite cette contamination sémantique et produit un ancrage plus interprétable. Pour un intégrateur ou un fabricant de bras manipulateurs, le ratio est favorable : gain de précision spatiale sans surcoût à l'inférence, et compatibilité avec des architectures VLA existantes sans refonte. Cette contribution s'inscrit dans la course aux VLA comme couche de contrôle universelle : Physical Intelligence (π0, π0.5), Google DeepMind et NVIDIA (GR00T N2), Figure AI (Helix) ou Unitree reposent tous sur des architectures de ce type. La faiblesse du raisonnement 3D dans les VLA reste un frein documenté au passage démo-vers-déploiement, et plusieurs équipes y travaillent via sim-to-real et foundation models 3D. VEGA choisit une voie minimaliste : pas de pipeline 3D à l'inférence, juste un alignement ciblé à l'entraînement. Aucun déploiement industriel ni partenariat commercial n'est mentionné, c'est une contribution académique, mais sa légèreté architecturale la rend directement intégrable dans des projets en cours.

IA physiqueOpinion
1 source
IA incarnée : conditionnement géométrique explicite des escaliers pour une locomotion humanoïde robuste
190arXiv cs.RO 

IA incarnée : conditionnement géométrique explicite des escaliers pour une locomotion humanoïde robuste

Des chercheurs ont publié sur arXiv (2605.09944) un cadre de conditionnement géométrique explicite pour la montée d'escaliers par robot humanoïde. Le système extrait trois paramètres compacts depuis la perception : la hauteur de marche, la profondeur de marche, et l'angle de lacet courant par rapport au cap du robot. Ces paramètres conditionnent directement une politique de locomotion entraînée par Proximal Policy Optimization (PPO), permettant une modulation proactive de la hauteur d'enjambée et des caractéristiques de foulée selon la géométrie de l'escalier. Validé sur le Unitree G1, humanoïde à 23 degrés de liberté de Unitree Robotics, le système a enchaîné 33 marches consécutives en extérieur sans défaillance lors des expériences en conditions réelles. Des tests en simulation confirment par ailleurs une généralisation à des hauteurs de marches hors de la distribution d'entraînement. L'intérêt de l'approche tient au choix de représentations explicites et interprétables plutôt que des encodages latents haute dimension. Les politiques de locomotion actuelles s'appuient généralement sur du feedback proprioceptif aveugle ou des représentations implicites du terrain, ce qui limite leur capacité à anticiper les ajustements de gait face à des géométries non vues, problème central du sim-to-real gap. En conditionnant la politique sur des paramètres lisibles par un ingénieur, le système peut moduler proactivement la hauteur d'enjambée avant le contact, là où une représentation opaque réagirait après coup. Pour un intégrateur ou un COO logistique, cela se traduit par une robustesse prédictive accrue dans des environnements réels non maîtrisés, sans instrumentation supplémentaire des escaliers. Le Unitree G1, commercialisé depuis 2024 à partir de 16 000 USD, s'est imposé comme plateforme de référence pour la recherche en locomotion humanoïde grâce à sa disponibilité et son prix d'accès. Unitree concurrence directement Agility Robotics (Digit), Boston Dynamics (Atlas) et des startups comme Figure ou 1X sur la capacité à opérer dans des espaces tertiaires et industriels non modifiés. La traversée d'escaliers reste un verrou opérationnel clé pour les déploiements logistiques et de services, segment où des acteurs européens comme Wandercraft et Enchanted Tools opèrent sur des créneaux voisins mais distincts. L'article, soumis en preprint sans revue par les pairs à ce stade, ne fournit pas de comparaison quantitative avec d'autres politiques sur le même matériel, ce qui limite l'évaluation rigoureuse des gains réels.

UELa traversée d'escaliers étant un verrou opérationnel clé pour les déploiements en espaces non modifiés, cette avancée fixe un niveau de référence que des acteurs européens comme Wandercraft et Enchanted Tools devront intégrer dans leur feuille de route locomotion.

RecherchePaper
1 source
AsyncVLA : correspondance de flux asynchrone pour les modèles vision-langage-action (VLA)
191arXiv cs.RO 

AsyncVLA : correspondance de flux asynchrone pour les modèles vision-langage-action (VLA)

Une équipe de chercheurs a publié AsyncVLA (arXiv:2511.14148), un cadre pour modèles Vision-Language-Action (VLA) qui remplace le flow matching synchrone (SFM) conventionnel par un mécanisme asynchrone (AFM) à calendrier temporel non uniforme. Là où le SFM applique un pas de temps identique à tous les tokens d'action, AsyncVLA ajuste ce calendrier en fonction du contexte actionnel en cours, et intègre un module "confidence rater" qui évalue la fiabilité de chaque token généré pour déclencher une auto-correction sélective avant exécution. La procédure d'entraînement est unifiée: un seul modèle peut opérer en mode SFM ou AFM, avec une meilleure utilisation du cache KV. Sur les benchmarks de manipulation robotique en simulation et en conditions réelles, AsyncVLA surpasse les méthodes existantes avec une efficacité accrue en données d'entraînement. Le code est publié en open source sur GitHub. L'instabilité des VLA sur les tâches longue durée (long-horizon) est l'un des principaux freins à leur déploiement industriel: en SFM, une erreur d'action se propage en cascade jusqu'à l'échec complet de la séquence. La capacité d'auto-correction d'AsyncVLA adresse directement ce point, ce qui intéresse les intégrateurs et les équipes robotiques confrontées à des cycles opératoires de plusieurs minutes. L'efficacité en données est un argument complémentaire: entraîner des VLA compétitifs nécessite aujourd'hui des datasets massifs et coûteux, et une méthode qui atteint de meilleures performances avec moins de données réduit la barrière d'entrée. Il faut toutefois nuancer: le papier se limite à des benchmarks de manipulation sans publier de chiffres de déploiement à l'échelle, de temps de cycle réels, ni de résultats sur une flotte opérationnelle. Les VLA à base de flow matching ont été popularisés par Pi-0 de Physical Intelligence et GR00T N2 de NVIDIA en 2024, établissant un standard de génération d'actions continues pour la robotique généraliste. AsyncVLA s'inscrit dans une tendance de raffinement algorithmique de ces architectures, aux côtés d'approches comme OpenVLA, la distillation de politique diffusion, ou les modèles hybrides VLA et planificateur symbolique. Son avantage comparatif est la compatibilité directe avec les pipelines SFM existants, sans rupture architecturale majeure, ce qui facilite l'adoption par les équipes déjà engagées sur ces bases. Les prochaines étapes crédibles seraient une validation sur des robots humanoïdes (Figure, 1X, Unitree) ou des bras industriels en production réelle, là où la robustesse long-horizon reste le goulot d'étranglement dominant.

💬 Le problème de propagation d'erreur en cascade dans les VLA, c'est exactement ce qui bloque le déploiement industriel depuis des mois. AsyncVLA l'attaque frontalement avec un mécanisme de correction sélective avant exécution, et la compatibilité directe avec les pipelines SFM existants (Pi-0, GR00T) rend l'adoption crédible sans tout casser. Reste à voir ce que ça donne sur des cycles de 10 minutes en prod réelle, pas juste en simulation.

IA physiqueOpinion
1 source
Figure et 1X accélèrent la production de robots humanoïdes
192IEEE Spectrum Robotics 

Figure et 1X accélèrent la production de robots humanoïdes

Figure atteint désormais une cadence de production de 55 robots humanoïdes par semaine, selon une annonce publiée fin avril 2026. Ces unités sont, selon la startup américaine, destinées aux équipes internes de R&D, à la collecte de données, au développement de tâches domestiques de bout en bout et à des "cas d'usage commerciaux en développement", une formulation qui interroge sur la destination réelle de cette production alors que les déploiements commerciaux restent à maturité. En parallèle, 1X Technologies a officiellement ouvert la NEO Factory à Hayward, en Californie : une usine de 58 000 pieds carrés (environ 5 400 m²) employant plus de 200 personnes, avec une chaîne entièrement intégrée couvrant moteurs, batteries, transmissions, capteurs, structures et assemblage final. Les premières unités NEO sortent déjà des lignes de production, avec des livraisons grand public annoncées pour 2026. Sur le plan technique, Agility Robotics a publié des tests d'équilibre dynamique sur une seule jambe pour son robot Digit, et une équipe de recherche a présenté HTD (Humanoid Transformer with Touch Dreaming), un système de manipulation humanoïde combinant téleopération VR, apprentissage par renforcement pour le bas du corps et capteurs tactiles distribués. La montée en cadence simultanée de Figure et 1X marque un glissement du secteur humanoïde vers la production industrielle, mais chaque annonce appelle une lecture critique. Produire 55 unités par semaine sans contrats commerciaux confirmés suggère soit une stratégie de collecte de données à grande échelle, ressource clé pour l'entraînement des politiques VLA (Vision-Language-Action), soit une anticipation agressive de la demande avant une prochaine levée de fonds. L'intégration verticale revendiquée par 1X, inspirée du modèle Tesla, offre une flexibilité d'itération et réduit la dépendance aux fournisseurs, mais mobilise des capitaux considérables. Les travaux d'Agility sur l'équilibre dynamique illustrent par ailleurs que le gap sim-to-real reste un verrou technique central : la moindre divergence entre modèle simulé et robot réel peut provoquer une instabilité en conditions réelles, limitant directement la fiabilité en milieu industriel. Figure, fondée en 2022 par Brett Adcock, a levé plus de 750 millions de dollars avec BMW, Microsoft et Amazon comme partenaires, et opère un pilote chez BMW Manufacturing en Caroline du Sud depuis 2024, bien que les vidéos publiées restent en conditions contrôlées. 1X, société norvégienne soutenue par OpenAI et Tiger Global, se positionne sur le marché résidentiel face à Tesla Optimus (déployé progressivement dans les usines Tesla), aux robots Agility Digit (opérés chez Amazon) et aux fabricants chinois comme Unitree (G1, H1) qui exercent une pression tarifaire croissante. Aucun acteur européen, ni Wandercraft, ni Enchanted Tools, ni Pollen Robotics, n'annonce de production à ce volume pour l'instant. Les prochains trimestres détermineront si ces cadences correspondent à des commandes fermes ou à une stratégie de positionnement avant financement.

UELa montée en cadence de Figure et 1X exerce une pression concurrentielle sur les acteurs européens (Wandercraft, Enchanted Tools, Pollen Robotics), qui n'annoncent pas de volumes de production comparables à ce stade.

HumanoïdesActu
1 source
Apprentissage de politiques de loco-manipulation quadrupède avec perception tactile
193arXiv cs.RO 

Apprentissage de politiques de loco-manipulation quadrupède avec perception tactile

Une équipe de chercheurs a publié en avril 2026 sur arXiv (2604.27224) un pipeline hiérarchique de loco-manipulation pour robots quadrupèdes intégrant le retour tactile. Le système combine une politique visuotactile de haut niveau, entraînée sur des démonstrations humaines réelles, qui prédit simultanément les trajectoires de l'effecteur terminal et les signaux tactiles attendus caractérisant l'évolution du contact, avec une politique corps-entier entraînée par reinforcement learning à grande échelle en simulation et transférée zero-shot sur robot physique. Évalué sur trois tâches à contact riche (réorientation en main avec insertion, serrage de vanne, manipulation d'objets fragiles), le système affiche un gain moyen de 28,54 % par rapport aux baselines vision seule et visuotactile sans prédiction tactile. L'apport principal est de démontrer que vision et proprioception restent insuffisantes pour résoudre des contacts incertains et évolutifs, et que le retour tactile fournit une observabilité directe que les autres modalités ne peuvent pas suppléer. La mise à l'échelle de l'apprentissage tactile à un système complet de loco-manipulation quadrupède est une contribution distinctive : la littérature récente s'était concentrée sur les bras fixes et les mains dextres, laissant les plateformes mobiles en dehors du périmètre. Le transfert zero-shot sim-to-real de la politique multimodale corps-entier valide par ailleurs qu'il est possible de combler le gap simulation-réalité sur des politiques sensorielles complexes sans fine-tuning sur robot physique, un résultat concret pour les déploiements industriels. La manipulation par quadrupèdes s'est accélérée depuis 2023 avec Spot (Boston Dynamics) et ANYmal (ANYbotics, ETH Zurich), qui s'appuient cependant essentiellement sur la vision et la proprioception. L'intégration d'une couche tactile hiérarchique sur des systèmes mobiles reste une extension non triviale, absente des plateformes Unitree B2/Z1 ou des travaux sur MIT Cheetah. La suite logique inclut l'extension à des capteurs haute densité (GelSight, capacitif distribué) et à des chaînes de manipulation multi-étapes en milieu industriel réel. Ce travail est un preprint non encore évalué par les pairs, ce qui invite à la prudence sur la généralisabilité des résultats au-delà du protocole expérimental décrit.

UELes résultats sur le transfert zero-shot sim-to-real et la manipulation tactile quadrupède sont directement pertinents pour ANYbotics (spin-off ETH Zurich) et ses déploiements d'inspection industrielle en Europe, où ANYmal constitue la plateforme de référence.

RecherchePaper
1 source
Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique
194Interesting Engineering 

Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique

La société de construction britannique Tilbury Douglas est devenue la première grande entreprise du secteur au Royaume-Uni à déployer un robot humanoïde sur un chantier réel. Baptisé Douglas, le robot de 30 kg est fabriqué par Unitree, l'un des leaders mondiaux du marché des robots humanoïdes. Il a déjà prouvé son utilité lors d'un essai de dix semaines sur site actif. Sa mission n'est pas de poser des briques ni de couler du béton, mais de prendre en charge les tâches administratives et de collecte de données qui mobilisent quotidiennement les équipes. Équipé de capteurs LiDAR et de caméras 360 degrés, Douglas parcourt le chantier de façon autonome, photographie les avancées de la construction depuis des coordonnées identiques chaque jour, effectue des scans laser pour générer des nuages de points en trois dimensions, et alimente directement les flux de travail liés à la sécurité. Résultat : environ 40 heures de travail administratif économisées chaque mois, soit une semaine complète rendue aux équipes terrain. Cet apport concret change la donne pour les chefs de chantier, qui passaient jusqu'ici une partie de leur journée à arpenter les structures en acier et les pièces inachevées pour documenter l'avancement des travaux. En confiant cette routine à la machine, Tilbury Douglas libère ses professionnels pour des tâches à plus forte valeur ajoutée : coordination technique, résolution de problèmes complexes, management des équipes. La précision du robot dépasse également celle d'un humain sur certains points : en capturant les données depuis exactement les mêmes positions chaque jour, il permet aux logiciels d'IA de détecter automatiquement les déviations et les défauts de construction que l'oeil humain pourrait rater. À 15 000 livres sterling, son coût reste relativement accessible pour une entreprise du secteur. Le timing de ce déploiement n'est pas anodin. Le secteur de la construction britannique traverse une pénurie de compétences structurelle, peinnant à recruter la prochaine génération d'ingénieurs et de chefs de projet. C'est dans ce contexte que Tilbury Douglas, via son directeur technique Mark Buckle, présente Douglas non pas comme un substitut aux travailleurs, mais comme un outil pour les renforcer en automatisant les tâches répétitives. Pour l'heure, le robot est maintenu à distance des bords de chantier pour éviter les chutes, et sera prochainement équipé de marquages haute visibilité et d'une balise d'avertissement pour évoluer en sécurité à proximité d'engins lourds dès les phases de fondation. Cette expérience illustre une tendance de fond : l'IA et la robotique bouleversent les métiers manuels tout autant que les fonctions de bureau, redessinant en profondeur l'organisation du travail dans les industries physiques.

UELe secteur du BTP européen, confronté aux mêmes pénuries structurelles de main-d'œuvre qualifiée qu'au Royaume-Uni, pourrait rapidement s'inspirer de ce déploiement, les robots Unitree étant déjà commercialisés en Europe.

HumanoïdesActu
1 source
Apprentissage du parkour pour quadrupèdes : mélange d'experts parcimonieux avec entrée visuelle
195arXiv cs.RO 

Apprentissage du parkour pour quadrupèdes : mélange d'experts parcimonieux avec entrée visuelle

Des chercheurs ont publié sur arXiv (référence 2604.19344) une étude comparant deux architectures de réseaux de neurones pour le contrôle d'un robot quadrupède Unitree Go2 face à des obstacles de parkour, notamment des marches et discontinuités élevées. L'architecture testée repose sur un mécanisme dit de "mixture d'experts à portes creuses" (sparsely gated MoE) : au lieu d'activer tous les paramètres du réseau à chaque inférence, seul un sous-ensemble d'experts spécialisés est sollicité selon le contexte. Les résultats sur robot réel sont nets : la politique MoE atteint le double de taux de succès dans la traversée de grands obstacles par rapport à une baseline MLP classique, à budget computationnel identique (même nombre de paramètres actifs à l'inférence). Pour obtenir des performances équivalentes avec un MLP dense, il faut augmenter sa taille totale au niveau du MoE complet, ce qui entraîne une hausse de 14,3 % du temps de calcul. L'intérêt de ce résultat tient moins aux performances brutes qu'à ce qu'il démontre structurellement : les gains architecturaux qui ont propulsé les grands modèles de langage (Mixtral, GPT-4 et consorts utilisent des variantes MoE) sont transférables aux politiques de contrôle robotique bas niveau. Cela valide une intuition croissante dans la communauté : la scalabilité des politiques de locomotion n'est pas uniquement une question de données ou de sim-to-real, mais aussi d'architecture. Pour les équipes travaillant sur des robots embarqués avec contraintes computationnelles, l'activation creuse offre un levier concret pour améliorer les performances sans alourdir les exigences matérielles. Le parkour quadrupède s'est imposé ces deux dernières années comme un benchmark exigeant pour la locomotion, avec des travaux notables issus de Berkeley, ETH Zurich et CMU sur des plateformes similaires (ANYmal, Spot, Go1/Go2). L'approche dominante jusqu'ici reposait sur des MLP séquentiels entraînés par reinforcement learning en simulation puis transférés sur le robot physique. Cette étude, dont le code est accessible en version anonymisée, ouvre une piste d'amélioration architecturale orthogonale aux efforts habituels sur les données ou les environnements de simulation. Les prochaines étapes naturelles concerneraient l'extension à des environnements plus complexes et l'évaluation du comportement des experts spécialisés pour mieux comprendre la décomposition fonctionnelle apprise.

RecherchePaper
1 source
Motorevo lève plusieurs dizaines de millions de dollars en série A++, son sixième tour de financement en un an
196Pandaily 

Motorevo lève plusieurs dizaines de millions de dollars en série A++, son sixième tour de financement en un an

Motorevo, fabricant chinois de modules d'articulations robotiques fondé en 2023, vient de boucler un tour de table A++ de plusieurs centaines de millions de RMB (soit plusieurs dizaines de millions de dollars USD), mené par Shenzhen Investment Holdings avec la participation de Genesis Capital. Il s'agit du sixième financement en l'espace d'un an, après cinq tours successifs baptisés A2 à A6 en 2025. Le PDG Chen Wankai a indiqué que les fonds serviront au développement technologique avancé, à l'élargissement de la gamme produit et à l'amélioration des capacités de fabrication et de livraison. La société propose des modules d'articulations intégrés couvrant les séries planétaires, harmoniques et cycloïdales, avec des plages de couple allant de 2 Nm à 400 Nm, destinés aux robots humanoïdes, quadrupèdes, exosquelettes et cobots. En 2025, les expéditions annuelles ont dépassé 100 000 unités, les commandes ont franchi les 150 millions de RMB (environ 21 millions USD), et l'entreprise a atteint la rentabilité. Ce qui retient l'attention, c'est moins le montant du tour que la trajectoire opérationnelle : six levées en douze mois pour un fabricant de composants, combinées à une rentabilité déjà atteinte, signalent un modèle économique solide dans un segment, les actionneurs intégrés, qui reste un goulot d'étranglement critique pour toute la filière humanoïde. La capacité à livrer 100 000 modules par an en 2025, avec une montée à 300 000-500 000 unités prévue d'ici 2026, positionne Motorevo comme fournisseur de tier-1 potentiel pour les intégrateurs qui peinent à sécuriser des chaînes d'approvisionnement en actionneurs à haute performance. Le site de production de Wuxi, opérationnel depuis avril, affiche un taux d'automatisation supérieur à 85 % et un temps de cycle de l'ordre de 90 secondes par module, des métriques industriellement significatives si elles se confirment en production de série. Motorevo s'inscrit dans une vague de spécialistes chinois des composants robotiques qui capitalisent sur l'explosion de la demande domestique en humanoïdes, portée par des acteurs comme Unitree, Leju Robotics (client référencé de Motorevo) ou Agibot. Face à eux, les équivalents occidentaux, Harmonic Drive, Maxon, ou des startups comme Hebi Robotics, peinent à rivaliser sur les volumes et les coûts. La prochaine étape pour Motorevo sera de démontrer la tenue en fiabilité de ses modules sous charge industrielle continue, condition sine qua non pour convaincre les intégrateurs au-delà des pilotes initiaux.

UEPression concurrentielle directe sur les fabricants européens d'actionneurs (notamment Maxon, Harmonic Drive Europe) : Motorevo atteint des volumes et des coûts que les équivalents occidentaux peinent à égaler, ce qui fragilise leur position de fournisseurs tier-1 auprès des intégrateurs de robots humanoïdes.

Chine/AsieActu
1 source
MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée
197arXiv cs.RO 

MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée

Des chercheurs du MMlab (Hong Kong) ont publié les spécifications complètes de MM-Hand, une main robotique à actionnement tendineux déporté dotée de 21 degrés de liberté (DOF). L'architecture centrale repose sur la délocalisation des moteurs vers la base du robot ou un hub moteur externe, les tendons transitant par des gaines flexibles jusqu'aux doigts. La main intègre des doigts à retour par ressort, des structures palmaire et digitale modulaires imprimées en 3D, des connecteurs tendineux à remplacement rapide, ainsi qu'un système de captation multimodale comprenant des encodeurs articulaires, des capteurs tactiles, un retour d'effort côté moteur, et une caméra stéréo embarquée dans la paume. Les expériences publiées rapportent une force de 25 N en bout de doigt via une transmission tendon-gaine d'un mètre, et les essais en boucle fermée ont été conduits aussi bien bras statique que bras en mouvement. L'ensemble des designs matériels et logiciels est publié en open source. Ce travail s'attaque à un verrou classique de la manipulation dextère à haute densité de DOF : l'encombrement thermique et massique des actionneurs embarqués dans la main. En déportant les moteurs, MM-Hand libère le volume intra-main pour des capteurs et des mécanismes supplémentaires, ce qui change concrètement l'équation pour les laboratoires de recherche en manipulation. La combinaison vision stéréo palmaire et toucher tactile dans un seul effecteur ouvre la voie à des politiques d'apprentissage multimodal (VLA, diffusion policies) sans avoir à multiplier les capteurs externes. La publication open source de la mécanique et du firmware est un signal fort : les auteurs misent sur la réplication communautaire pour valider le passage à l'échelle, ce que les démonstrations en laboratoire seul ne peuvent pas prouver. MM-Hand s'inscrit dans un effort plus large d'industrialisation de la main robotique dextère, un segment où l'on retrouve Shadow Robotics (UK, 24-DOF, câbles), Inspire Robots (Chine, utilisée sur Unitree H1 et G1) et Wonik Robotics (Allegro Hand, 16-DOF, courroies). La différenciation revendiquée de MM-Hand est sa maintenabilité modulaire et son coût de reproduction accessible via impression 3D. Le MMlab n'a pas annoncé de partenariat industriel ni de feuille de route de commercialisation : il s'agit pour l'instant d'une plateforme de recherche publiée, pas d'un produit shipé.

UELes laboratoires européens de recherche en manipulation dextère peuvent répliquer MM-Hand grâce à la publication open source complète (mécanique + firmware), mais aucun partenariat ni déploiement européen n'est annoncé par le MMlab.

RecherchePaper
1 source
Suivi simplifié : retargeting neural des mouvements pour le contrôle global du robot humanoïde
198arXiv cs.RO 

Suivi simplifié : retargeting neural des mouvements pour le contrôle global du robot humanoïde

Une équipe de chercheurs a publié NMR (Neural Motion Retargeting), un framework d'apprentissage automatique conçu pour résoudre l'un des verrous fondamentaux de la robotique humanoïde : transférer des mouvements humains bruts vers un robot physique sans générer d'artefacts cinématiques. Testé sur le Unitree G1, un humanoïde à 23 degrés de liberté commercialisé autour de 16 000 dollars, NMR démontre sa capacité sur des tâches dynamiquement exigeantes comme les arts martiaux et la danse. Les résultats publiés montrent une élimination quasi-totale des "joint jumps" (discontinuités articulaires) et une réduction significative des auto-collisions par rapport aux méthodes de référence actuelles, tout en accélérant la convergence des politiques de contrôle en aval. Le problème que NMR adresse est structurel. Les approches traditionnelles par optimisation géométrique sont non-convexes et convergent systématiquement vers des optima locaux, produisant des mouvements physiquement incohérents inutilisables pour l'entraînement de politiques de contrôle. NMR reformule le problème différemment : au lieu de chercher une solution optimale, il apprend la distribution des données de mouvement valides. Le pipeline repose sur CEPR (Clustered-Expert Physics Refinement), qui utilise un VAE pour regrouper les mouvements humains hétérogènes en motifs latents homogènes, puis fait intervenir des experts en reinforcement learning massivement parallèle pour projeter chaque cluster sur le manifold de mouvements réalisables du robot. Ces données haute-fidélité supervisent ensuite un réseau hybride CNN-Transformer non-autoregressif capable de raisonner sur le contexte temporel global, évitant les pièges géométriques locaux. L'implication pour les intégrateurs est directe : un pipeline de retargeting plus robuste signifie moins de curation manuelle des données de démonstration, goulot d'étranglement majeur dans le développement de politiques whole-body. Ce travail s'inscrit dans une compétition intense autour du sim-to-real et du retargeting humain-robot, domaine où s'affrontent des approches comme SMPL-based retargeting, PhysHOI ou encore les pipelines de Berkeley Humanoid. Unitree, fabricant chinois qui positionne le G1 comme plateforme de recherche accessible face aux robots Figure, Agility ou Boston Dynamics, bénéficie directement de ces avancées publiées en open research. La prochaine étape naturelle sera la validation sur des tâches de manipulation en environnement non structuré, où la cohérence whole-body entre locomotion et bras reste le défi non résolu du secteur.

RecherchePaper
1 source
Honor développe une gamme robotique après "Lightning", incluant un robot quadrupède et une main dexterique
199Pandaily 

Honor développe une gamme robotique après "Lightning", incluant un robot quadrupède et une main dexterique

Honor, le fabricant chinois de smartphones, a présenté deux nouveaux produits robotiques lors de la China Humanoid Robot Ecosystem Conference, tenue du 17 au 19 avril 2026 au Shanghai Auto Exhibition Center. Wang Ai, directeur de la stratégie pour l'intelligence incarnée chez Honor, a annoncé "Anzai", un robot quadrupède de type chien, et "Luban", une main robotique dextère. Ces annonces interviennent quelques semaines après la présentation de "Lightning", le premier robot humanoïde de la marque, dévoilé au Mobile World Congress en mars 2026. Le 19 avril, Lightning a remporté la catégorie navigation autonome du Semi-Marathon des robots humanoïdes de l'E-Town de Pékin, avec six robots Honor classés dans les six premières places de la catégorie. L'événement réunissait également Unitree Robotics, Leju Robotics, Zhongqing Robotics et Galaxy General Robotics. L'entrée de Honor dans la robotique illustre une tendance de fond : les grands acteurs de l'électronique grand public cherchent à capitaliser leurs écosystèmes logiciels et leur maîtrise des capteurs pour accélérer le déploiement de robots incarnés. Wang Ai a explicitement mentionné l'objectif d'intégrer les briques technologiques issues du smartphone, traitement du signal, IA embarquée, connectivité, dans une plateforme robotique unifiée. La victoire au semi-marathon est toutefois à contextualiser : il s'agit d'une compétition de navigation autonome en environnement semi-contrôlé, et non d'une démonstration de manipulation ou de travail en milieu industriel réel. Honor parle de produits destinés au marché grand public à terme, mais aucune date de commercialisation ni de prix n'ont été communiqués. Honor s'inscrit dans une course humanoïde chinoise qui s'est considérablement densifiée depuis 2024, avec des acteurs comme Unitree (dont le G1 est déjà commercialisé à l'international), Fourier Intelligence et Deep Robotics. Sur la main dextère, le segment "Luban" entre en compétition directe avec les solutions de Shadow Robot, Inspire Robots et SEED Robotics côté européen, ainsi que Dexterous Robotics aux États-Unis. Wang reconnaît que "l'intelligence incarnée fait encore face à de nombreux obstacles techniques et que l'industrie a besoin de plus de temps", formulation prudente qui contraste avec le registre conquérant du reste de la communication. Les prochaines étapes annoncées restent vagues : Honor n'a pas précisé de calendrier de déploiement pilote ni de partenariats industriels, et le passage de la démonstration au produit livrable demeure le principal point d'interrogation pour les intégrateurs.

UELa main dextère 'Luban' entre en concurrence directe avec des acteurs européens comme Shadow Robot (UK) et SEED Robotics, sans déploiement ni partenariat annoncé en Europe à ce stade.

Chine/AsieActu
1 source
Digit apprend à danser en une nuit grâce à la simulation
200IEEE Spectrum AI 

Digit apprend à danser en une nuit grâce à la simulation

Le robot humanoïde Digit d'Agility Robotics vient d'apprendre à danser en une nuit. Grâce à des données brutes de capture de mouvement, d'animation et de téléopération, l'équipe IA de l'entreprise a développé de nouvelles capacités de contrôle corporel via un entraînement par renforcement en simulation transféré ensuite au robot réel. Dans le même temps, la startup Generalist AI a annoncé GEN-1, un modèle d'IA généraliste pour la robotique physique atteignant 99 % de taux de réussite sur des tâches simples, contre 64 % pour les générations précédentes, avec une vitesse d'exécution environ trois fois supérieure et seulement une heure de données collectées sur robot réel par tâche. Unitree, de son côté, a rendu public depuis le 5 mars 2026 le dataset UnifoLM-WBT, un jeu de données open-source de téléopération whole-body pour robots humanoïdes en environnements réels, disponible sur Hugging Face avec des mises à jour fréquentes. Ces avancées illustrent une accélération concrète sur deux fronts majeurs : la généralisation des capacités motrices et la réduction des coûts de données d'entraînement. GEN-1 représente un saut qualitatif potentiellement décisif pour la viabilité commerciale des robots de service, en abaissant drastiquement le seuil d'échec sur des tâches répétitives industrielles ou logistiques. L'ouverture du dataset Unitree constitue elle un signal fort pour la communauté académique et les startups qui manquent de ressources pour collecter des données humanoïdes à grande échelle. Par ailleurs, Universal Robots démontre avec THEMAGIC5 comment des cobots automatisent les derniers 5 % d'une production personnalisée, permettant à une entreprise née sur Kickstarter de dépasser les 400 000 paires de lunettes de natation sur mesure vendues dans le monde. Ces démonstrations s'inscrivent dans une dynamique plus large où la frontière entre recherche et déploiement commercial s'efface rapidement. La conférence ICRA 2026 se tiendra à Vienne du 1er au 5 juin, et RSS 2026 à Sydney en juillet, deux rendez-vous clés où beaucoup de ces travaux seront formalisés. Sanctuary AI poursuit quant à elle le développement de ses mains hydrauliques à haute dextérité, capables de réorienter un objet de manière autonome vers une configuration cible. Enfin, la Chine a validé en orbite un bras robotique flexible embarqué à bord du satellite commercial Yuxing 3-06, ouvrant la voie au ravitaillement autonome en orbite. L'ensemble de ces actualités confirme que 2026 marque une inflexion décisive : la robotique physique entre dans une phase d'industrialisation rapide, portée par des modèles IA de plus en plus généralisés et des écosystèmes de données ouverts.

UEUniversal Robots (Danemark) illustre l'adoption des cobots dans la production personnalisée européenne, et la conférence ICRA 2026 à Vienne constituera un relais académique clé pour ces avancées en robotique physique.

HumanoïdesActu
1 source