Dossier Unitree — page 2

511 articles · page 2 sur 11

Unitree, l'humanoïde et quadrupède chinois low-cost : G1, H1, R1, prix grand public sur AliExpress, démonstrations agressives en vidéo et impact sur les concurrents premium.

51Robotics Business Review HumanoïdesActu

IA incarnée : comment les actionneurs intégrés améliorent les performances des articulations chez les robots humanoïdes

Voici l'article traduit et résumé : Le fabricant chinois CubeMars a développé l'AK45-10, un actionneur robotique intégré destiné aux articulations de robots humanoïdes. Le module mesure 53mm de diamètre pour environ 260 grammes, et délivre jusqu'à 7Nm de couple de pointe grâce à un réducteur planétaire à rapport 10:1. Sa particularité tient à l'intégration en un seul bloc du moteur brushless, du réducteur, de l'encodeur et de l'électronique de contrôle, au lieu d'assembler ces composants séparément comme le veut l'approche traditionnelle. CubeMars positionne ce produit pour équiper aussi bien les articulations du haut du corps (coudes, poignets) que celles du bas du corps (hanches, genoux), avec des besoins de couple et de stabilité différents selon la charge appliquée. Cette annonce illustre une tendance de fond dans l'industrie des robots humanoïdes plutôt qu'une rupture technologique isolée : la miniaturisation et l'intégration des actionneurs deviennent un enjeu central pour rendre les plateformes humanoïdes viables commercialement. Avec des dizaines d'articulations à motoriser par robot, le poids et l'encombrement cumulés des actionneurs pèsent directement sur l'autonomie énergétique et la complexité d'assemblage. Pour les intégrateurs et fabricants de robots, disposer de modules compacts et prêts à l'emploi réduit le câblage, la maintenance et le temps de développement, un facteur déterminant alors que plusieurs acteurs cherchent à passer du prototype de démonstration à la production en série. Il faut toutefois noter que l'article ne fournit ni prix, ni volumes de production, ni client identifié utilisant cet actionneur dans un robot complet : il s'agit d'une présentation produit, pas d'un déploiement confirmé sur une plateforme humanoïde nommée. CubeMars s'inscrit dans un marché des actionneurs pour robotique où la concurrence s'intensifie, notamment face à des fournisseurs spécialisés dans les moteurs à couple élevé et faible encombrement pour la robotique légère et les drones, secteur d'origine de plusieurs fabricants chinois de ce type de composants. La course aux articulations compactes fait écho aux besoins exprimés par les développeurs de plateformes humanoïdes comme Figure, Tesla avec Optimus, ou Unitree, qui doivent tous arbitrer entre couple, poids et coût par articulation. Sans annonce de partenariat ou de déploiement précis à ce stade, l'AK45-10 reste positionné comme un composant générique destiné aux développeurs de robots plutôt qu'un produit associé à un humanoïde spécifique déjà commercialisé.

1 source

52arXiv cs.RO

Apprentissage de priors moteurs hybrides réutilisables pour la locomotion humanoïde par imitation de mouvement

Une équipe de recherche propose un pipeline en trois étapes pour transformer l'imitation de mouvement humain en un "hybrid motion prior" (HMP) réutilisable pour la locomotion humanoïde. D'abord, une politique experte est entraînée par apprentissage par renforcement à imiter des séquences de motion capture humaine retargetées sur un squelette robotique. Cette expertise est ensuite distillée dans une architecture figée composée d'un encodeur proprioceptif, d'un codebook RVQ (residual vector-quantized) et d'un décodeur d'actions. Enfin, des politiques spécifiques à chaque tâche sont entraînées à sélectionner des entrées discrètes de ce codebook, sans jamais réentraîner le HMP sous-jacent. La méthode est évaluée en simulation sur trois tâches : suivi de vitesse, navigation vers un point cible, et récupération de chute avec suivi de vitesse. La politique de suivi de vitesse a ensuite été déployée sur un robot réel, un Unitree G1. Les chercheurs montrent aussi qu'entraîner le codebook avec un "rotation trick" plutôt qu'un estimateur straight-through classique améliore l'organisation de l'espace latent et réduit le nombre de chutes en aval. L'intérêt principal tient à la réutilisabilité : au lieu d'entraîner une politique RL distincte par tâche avec sa propre fonction de récompense, un seul module d'action reste figé et sert d'interface commune à plusieurs politiques de haut niveau. Cela répond à une limite connue de l'imitation de mouvement, dont les contrôleurs restent généralement de simples "suiveurs" de référence, inutilisables tels quels pour résoudre une tâche. Le codebook obtenu s'avère aussi interprétable : le nombre d'étages RVQ actifs module directement les types de démarche disponibles, un signal utile pour du contrôle hiérarchique. Pour les équipes qui construisent des piles logicielles humanoïdes, cette approche s'inscrit dans la même logique que les bibliothèques de compétences motrices low-level découplées des politiques de tâche, un principe partagé par des modèles VLA comme Pi-0, GR00T N2 ou Helix, même si ceux-ci ciblent surtout la manipulation. Ce travail s'inscrit dans la lignée des méthodes d'imitation de mouvement pour humanoïdes (type DeepMimic, ASE) qui cherchent depuis plusieurs années à extraire des priors moteurs génériques à partir de données de capture humaine. Le déploiement reste toutefois limité à un seul robot et une seule tâche testée en réel, la navigation et la récupération de chute n'ayant été validées qu'en simulation. Les auteurs présentent cela comme une brique réutilisable, ouvrant la voie à d'autres politiques de tâche construites sur le même HMP sans nouveau cycle d'entraînement complet.

RecherchePaper

1 source

5336Kr

Neurodeep AI (眸深智能), issue d'une professeure de Fudan et d'un ancien scientifique en chef d'Intel, boucle un tour Pre-A complémentaire de près de 100 millions de yuans pour son "cerveau incarné" embarqué

La start-up chinoise Motion Brain (眸深智能), spécialisée dans les "cerveaux incarnés" pour robots, a bouclé un nouveau tour Pre-A d'environ 100 millions de yuans (environ 13 millions d'euros), deux mois seulement après un tour Pre-A de 300 millions de yuans en mai 2026. Les investisseurs incluent une grande société chinoise de services immobiliers, un consortium hongkongais, la plateforme d'investissement industriel Jinyue Capital (瑾悦投资) adossée à plusieurs sociétés cotées, Chuanghehui Capital, ainsi que l'actionnaire historique Xuhui Capital. Un tour Pre-A+ de près de 500 millions de yuans est également en cours de finalisation. Fondée en janvier 2025 par Chen Tao, directeur du laboratoire de deep learning de l'université Fudan, Zhang Yimin, ex-chef scientifique d'Intel Chine, et l'entrepreneur en série Mu Zelin, l'entreprise revendique une valorisation multipliée par plus de dix depuis le début de l'année. Son équipe, issue de HiSilicon, Intel et Nvidia, développe depuis 2022 une architecture alternative aux modèles VLA (vision-langage-action) dominants, baptisée "World Motion Model": MLD (2022), premier modèle à représenter le mouvement dans un espace latent via diffusion, puis MotionGPT (NeurIPS 2023), qui découpe la posture humaine en environ 3000 "tokens de mouvement" prédits séquentiellement, comme un LLM prédit des mots. Le modèle actuel, STI-WM, s'entraîne sur 80% de vidéos internet, 10% de capture de mouvement et seulement 10% de données robot réelles, réduisant de 90% le besoin en données réelles pour une précision d'action annoncée à 99%. Pour un secteur où le fossé entre démonstrations vidéo et déploiements réels reste large, Motion Brain met en avant des chiffres concrets d'industrialisation plutôt que de simples démos: compression des modèles de plusieurs centaines de milliards à quelques dizaines de milliards de paramètres, latence d'inférence embarquée ramenée de 200 à 10 millisecondes, coût d'inférence par unité passé de 200 000 à 10 000 yuans, et adaptation à un nouveau corps robotique en deux semaines seulement. Ce dernier point intéresse directement les intégrateurs, puisque l'entreprise a déjà porté son cerveau sur plusieurs plateformes chinoises (Guanghua No.1 de Fudan, Unitree G1, Qinglong et Linglong du centre d'innovation robotique humanoïde de Shanghai) et mise sur des puces domestiques (Ascend 310/910 de HiSilicon, Horizon Robotics, Enflame S60) plutôt que sur Nvidia, un choix stratégique face aux restrictions d'exportation. Les techniques MLD et MotionGPT ont été citées à quatre reprises par le laboratoire DAIR de Nvidia dans son modèle ARDY, signe de reconnaissance académique, et l'équipe a remporté le prix du meilleur article à IJCAI 2025, seule équipe chinoise continentale distinguée en cinq ans. Sur le plan commercial, Motion Brain revendique environ 10 millions de yuans de revenus audités en 2025, 30 millions au premier semestre 2026, avec un objectif dépassant 50 millions sur l'année complète, portés par des contrats dans l'inspection industrielle, la gestion immobilière et la propreté urbaine, notamment avec un gestionnaire immobilier coté à Hong Kong et un leader chinois de la propreté urbaine coté en Chine continentale, tandis que des discussions sont en cours avec une grande chaîne de distribution et un fabricant d'électroménager.

Chine/AsieActu

1 source

54arXiv cs.RO

Milo, un chien-guide robotique entièrement autonome pour intérieur et extérieur

Milo est un chien-guide robotique entièrement autonome, présenté dans une prépublication arXiv (arXiv:2607.19530v1), et développé pour un coût matériel d'environ 2 000 dollars, contre près de 50 000 dollars pour l'acquisition et l'entretien d'un chien-guide vivant. La plateforme repose sur un robot quadrupède Unitree Go2 modifié, équipé d'une poignée pour le harnais humain, de capteurs et de tout le calcul embarqué nécessaire, sans dépendance à un serveur externe. Son architecture logicielle combine une pile de perception, cartographie voxel, détection du sol, des obstacles et des piétons, et une pile de navigation fondée sur une politique d'évitement d'obstacles entraînée dans un simulateur vue de dessus (bird's-eye-view) développé en interne. Les auteurs ont testé Milo sur des parcours d'obstacles réels, en intérieur et en extérieur, et l'ont comparé à une approche de référence basée sur une costmap classique, observant une navigation plus fluide et moins de collisions avec le porteur du harnais. L'ensemble, matériel et logiciel, est publié en open source. L'enjeu dépasse la simple démonstration technique. Les chiens-guides robotiques sont envisagés depuis plusieurs années comme alternative aux chiens vivants pour les personnes aveugles ou malvoyantes, mais les prototypes existants butaient sur un problème récurrent: ils nécessitaient un scan 3D préalable de l'environnement ou un calcul déporté, les rendant inutilisables hors d'un cadre contrôlé. En démontrant une autonomie complète, sans connaissance a priori des lieux et sans calcul externe, Milo répond directement à cet écart entre démonstration en laboratoire et déploiement réel, un problème classique en robotique mobile assistive. Le choix de l'open source, à la fois hardware et software, vise explicitement à abaisser la barrière d'accès pour la communauté BLV (blind and low-vision) et pour les chercheurs qui voudraient reproduire ou améliorer la plateforme, plutôt que de verrouiller la technologie derrière un produit commercial fermé. Le projet s'inscrit dans la lignée des travaux académiques sur la navigation collaborative homme-robot utilisant des plateformes quadrupèdes commerciales comme base matérielle, une stratégie déjà explorée par d'autres équipes universitaires mais généralement limitée par l'autonomie de perception. En misant sur un simulateur maison pour l'entraînement de la politique de navigation plutôt que sur des données réelles coûteuses à collecter, les auteurs ouvrent la voie à des itérations rapides. La publication complète du code et des instructions de fabrication laisse présager des reproductions et extensions par la communauté robotique et accessibilité dans les mois à venir.

RecherchePaper

1 source

55arXiv cs.RO

Étude empirique : qu'est-ce qui compte dans le suivi de mouvement général des humanoïdes ?

Une équipe de recherche a publié une étude empirique sur les facteurs qui déterminent la qualité des politiques de suivi de mouvement pour humanoïdes, accompagnée d'un framework open-source baptisé YAHMP, testé sur le robot Unitree G1. Les auteurs ont défini une configuration nominale puis fait varier isolément plusieurs choix de conception courants dans les pipelines d'imitation de mouvement : la représentation des commandes de mouvement, l'historique d'observation utilisé par la politique, la représentation de l'action, le profil d'actionnement, l'ajout d'une randomisation de force appliquée aux mains pendant l'entraînement, et l'approche d'entraînement elle-même. Ces variantes ont été évaluées sur un jeu de test de mouvements humains retargetés vers le squelette du robot, avec TWIST2 comme référence externe entraînée sur le même corpus de mouvements. Les politiques issues de YAHMP ont ensuite été déployées en zero-shot sur un G1 réel, démontrant un suivi de mouvements variés en tout le corps, un maintien de l'équilibre face à des perturbations externes, et une capacité d'interaction physique forcée. L'intérêt principal de ce travail n'est pas une nouvelle performance record, mais une clarification méthodologique rare dans un domaine où les papiers annoncent souvent des résultats sans isoler l'effet de chaque choix d'architecture ou d'entraînement. En distinguant les paramètres qui influencent réellement la précision du suivi de ceux qui ne modifient que l'effort d'actionnement, la complexité d'entraînement ou la capacité d'interaction physique, l'étude fournit une base concrète pour rationaliser la conception des pipelines VLA et d'imitation de mouvement, un sujet critique alors que l'industrie cherche à transférer des politiques de simulation vers des déploiements réels fiables. Ce travail s'inscrit dans la lignée des recherches sur le contrôle whole-body des humanoïdes via imitation de mouvement, un axe où le Unitree G1 s'est imposé comme plateforme de référence pour la recherche académique grâce à son coût et son accessibilité. La comparaison directe avec TWIST2 positionne YAHMP comme un outil de benchmarking reproductible plutôt qu'un simple système propriétaire, les auteurs ayant choisi l'ouverture du code comme condition de validation de leurs conclusions.

RecherchePaper

1 source

56Pandaily

Ant Group dévoile sa stratégie duale VLA et modèles d'action du monde pour l'IA physique, écosystème open source et défi des données

Ant Group a fondé en décembre 2024 Ant LingBot, filiale à 100 % basée à Shanghai et bras armé du groupe dans l'IA physique, où plus de 90 % des effectifs sont titulaires d'un master ou d'un doctorat. Dirigée par le PDG Zhu Xing et le scientifique en chef Shen Yujun, l'entreprise a présenté six modèles d'IA incarnée en open source lors du WAIC 2026, couvrant vision, vidéo, perception spatiale, manipulation, modèles du monde et modèles d'action du monde. Sa stratégie technologique repose sur deux voies parallèles. La première, VLA (vision language action), incarnée par LingBot-VLA 2.0, suit l'architecture dominante du secteur, celle qu'utilisent aussi Figure ou la série RT de Google DeepMind. La seconde, portée par LingBot-VA 2.0, prédit l'évolution du monde avant de générer une action ; présenté comme le premier modèle d'action du monde nativement incarné du secteur, il est entraîné from scratch sur une architecture autorégressive atteignant 150 Hz d'inférence temps réel sur un seul GPU, avec tokenisation sémantique visuelle-action, pré-entraînement causal strict, architecture MoE et inférence asynchrone permettant au robot de prédire ses états futurs tout en exécutant l'action en cours, avec un temps de réponse de 6,7 millisecondes, contre 300 à 400 millisecondes pour un clignement d'œil humain. Plus d'une dizaine de fabricants ont noué des partenariats, dont Unitree Robotics, Xinghaitu et Leju Robotics, dont le KUAVO 4 Pro a été adapté à LingBot-VLA sur 95 scénarios de manipulation réels. LingBot commercialise aussi son propre robot de service, le Robbyant R1, destiné aux usages domestiques, à la santé et aux personnes âgées, mais dont les volumes livrés restent limités. Ce choix d'ouvrir intégralement poids, code, outils de post-entraînement et benchmarks d'évaluation, à un moment où les standards techniques de l'IA incarnée restent instables, vise à faire de LingBot une base logicielle partagée entre plateformes matérielles hétérogènes. Mais la principale contrainte du secteur demeure la donnée : contrairement aux LLM entraînés sur des billions de tokens textuels, les données d'interaction physique ne s'accumulent que par l'exploitation réelle de robots. LingBot compense en s'appuyant sur les données de ses partenaires (Unitree, Leju, Xinghaitu) plutôt qu'en opérant sa propre flotte, une dépendance qui fragilise sa position à mesure que ces mêmes partenaires développent leurs propres capacités IA. Cette approche intégrale, du modèle cerveau au modèle du monde jusqu'au déploiement matériel, distingue LingBot des autres géants technologiques chinois. Alibaba, Tencent, Huawei, JD.com et Meituan privilégient tous des stratégies plus ciblées, et Ant Group entre en outre en concurrence avec d'autres initiatives affiliées à Alibaba. LingBot constitue ainsi un test grandeur nature : une entreprise de la fintech peut-elle incuber une activité robotique viable, et l'open source combiné à l'emprunt de données suffira-t-il à surmonter les limites structurelles de l'IA incarnée ?

Chine/AsieOpinion

1 source

57Robotics Business Review

U.K. : Humanoid lève 152 millions de dollars en série A

L'entreprise britannique Humanoid, basée à Londres, a annoncé avoir levé 152 millions de dollars lors d'un tour de série A, valorisant la société à 1,35 milliard de dollars post-money. Ce financement porte le total levé depuis sa création à 270 millions de dollars. Fondée en 2024 sous le nom SKL Robotics Ltd, l'entreprise dirigée par Artem Sokolov développe le HMND 01 Alpha Wheeled, un manipulateur mobile bimanuel monté sur roues actuellement proposé en accès anticipé à des clients industriels, ainsi qu'une version bipède encore en développement. Le robot fonctionne sous KinetIQ, un framework logiciel destiné à orchestrer des flottes de robots humanoïdes de bout en bout ; sa déclinaison KinetIQ Ascend ajoute une capacité d'apprentissage par essai-erreur. Les fonds serviront à développer une nouvelle génération de plateforme, à lancer une version bêta des robots au quatrième trimestre 2026 chez des clients en logistique, manufacturing et retail, à démarrer la production en série des versions à roues, et à poursuivre le développement de KinetIQ. Schaeffler, via son PDG Klaus Rosenfeld, et Bosch, via son CTO Mathias Pillin et sa filiale Robert Bosch Robotics GmbH, sont annoncés comme investisseurs stratégiques et partenaires industriels, Bosch endossant notamment le rôle de sous-traitant de fabrication. Ce tour de table, que Humanoid présente comme le plus important jamais levé en série A par une entreprise européenne de robotique humanoïde, illustre l'accélération du financement du secteur bien au-delà des seuls acteurs américains ou chinois. L'implication directe de deux poids lourds industriels allemands comme partenaires commerciaux, et non de simples investisseurs financiers, signale un pari sur le passage de la démonstration technologique au déploiement industriel réel, un cap que la plupart des acteurs du secteur n'ont pas encore franchi. L'annonce mélange toutefois volontairement financement, partenariats et feuille de route produit : les déploiements "long terme" et la bêta prévue au quatrième trimestre 2026 restent des objectifs annoncés, pas des livraisons effectives, et la formule du fondateur selon laquelle l'entreprise aurait accompli "en deux ans ce qui prendrait normalement une décennie" relève davantage de la rhétorique de levée de fonds que d'un fait vérifiable. Le marché du robot humanoïde industriel s'est nettement densifié depuis un an. En Allemagne, NEURA Robotics vient d'ouvrir un tour de série C visant 1,4 milliard de dollars. Aux États-Unis, Figure AI a bouclé en septembre 2025 une série C supérieure au milliard de dollars, tandis qu'Apptronik a enchaîné plusieurs levées, dont une série A de 520 millions de dollars annoncée en février 2026. Agility Robotics a rejoint les marchés publics via une introduction en bourse par SPAC valorisée 620 millions de dollars, et Unitree a également entamé son introduction en bourse. D'autres acteurs comme AI² Robotics, 1X Technologies ou Leju Robotics complètent ce paysage très concurrentiel, dans lequel la levée de Humanoid confirme surtout que l'Europe, jusqu'ici en retrait face aux États-Unis et à la Chine sur ce segment, cherche désormais à peser financièrement dans la course aux humanoïdes industriels.

UEDeux industriels allemands majeurs, Bosch et Schaeffler, s'engagent comme partenaires strategiques et sous-traitant de fabrication aupres d'une entreprise britannique de robotique humanoide, renforcant l'ancrage industriel europeen face aux Etats-Unis et a la Chine.

FR/EU ecosystemeOpinion

1 source

58arXiv cs.RO

Fermeture de la boucle en VLA humanoïde : jetons d'objets 3D persistants pour une loco-manipulation vérifiable

Des chercheurs viennent de publier sur arXiv (2607.18016v1) une nouvelle méthode baptisée Persistent Object Tokenization (POT), testée sur un robot humanoïde Unitree G1 dans le cadre d'un système appelé POT-VLA. Le problème ciblé est ce que les auteurs nomment la "divergence d'état objet" : dans les politiques vision-langage-action (VLA) actuelles, l'état de l'objet utilisé pour décider d'un mouvement du corps entier peut différer de celui utilisé ensuite pour vérifier si l'action a bien produit la relation physique voulue, un décalage qui devient critique lors de déplacements, contacts, occlusions ou phases de récupération. POT maintient des enregistrements 3D d'objets indexés par rôle, construits à partir d'observations RGB-D, et les convertit en tokens exploitables par un module d'action corps entier. Sur huit familles de tâches réelles, POT-VLA fait passer le taux de réussite de 39 sur 80 à 71 sur 80 par rapport à une base directe GR00T-N1.7 comparable. Sur un protocole externe aligné sur le benchmark Being-0, le système obtient 44 succès sur 50 tâches de service, contre 37 sur 50 rapportés dans l'article Being-0 original. Pour l'industrie de la robotique humanoïde, ce travail s'attaque à un angle mort souvent glissé sous le tapis dans les démonstrations impressionnantes : la capacité réelle à maintenir une relation géométrique correcte entre un bras et un objet pendant une tâche longue, plutôt que la seule génération d'une trajectoire plausible. En rendant l'état objet à la fois exploitable et vérifiable via des contrôles de prédicats géométriques, le système ferme la boucle entre perception et exécution, un point sensible pour les intégrateurs qui cherchent des garanties de fiabilité au-delà des vidéos de démonstration soigneusement sélectionnées. Les gains les plus marqués concernent justement les tâches nécessitant le maintien prolongé d'une relation 3D, ce qui suggère que l'abstraction d'objet persistant comble une limite structurelle des architectures VLA actuelles plutôt qu'un simple réglage fin. Ce papier s'inscrit dans la course actuelle autour des politiques VLA pour humanoïdes, dominée par des architectures comme GR00T (NVIDIA), utilisée ici comme base de comparaison directe, et des benchmarks de référence comme Being-0 pour les tâches de service. L'usage d'un Unitree G1, plateforme largement adoptée dans la recherche académique en loco-manipulation, ancre les résultats dans un cadre reproductible plutôt que propriétaire. Les auteurs ne mentionnent pour l'instant ni déploiement pilote ni calendrier de commercialisation : il s'agit d'une contribution de recherche, destinée à être étendue à davantage de familles de tâches et potentiellement intégrée à d'autres piles VLA que GR00T.

RecherchePaper

1 source

59Pandaily

WAIC 2026 Robotique : quatre changements fondamentaux après 30 000 pas dans les allées du salon

Trois jours et environ 30 000 pas dans le hall robotique du WAIC 2026 à Shanghai suffisent à identifier quatre ruptures dans l'industrie des robots humanoïdes. D'abord, le salon a cessé d'être une scène de démonstration pour devenir un lieu de transactions concrètes: les visiteurs ne se contentent plus de regarder des robots danser ou donner des coups de pied dans un ballon, ils négocient prix, délais de livraison et cas d'usage. Des stands affichent des tarifs de location à partir de 100 yuans par jour ou 3 000 yuans par mois, et des délégations d'acheteurs internationaux, badges "Buyers" au cou, signent des bons de commande directement sur place. Ensuite, le contrôle moteur s'est banalisé. Là où Unitree faisait figure d'exception il y a peu, le T1 de Booster Robotics marque des buts avec précision, le Tiangong 3.0 du Beijing Humanoid Innovation Center enchaîne des chorégraphies, et le Q1 d'AGIBOT boxe. Marcher, courir, sauter sont désormais des prérequis basiques plutôt que des arguments de différenciation. Cette convergence technique a des conséquences directes pour les intégrateurs et les décideurs industriels. Selon le CTO de LimX Dynamics, l'écart entre les acteurs sur le contrôle de mouvement s'est nettement réduit, ce qui déplace la compétition ailleurs. Troisième rupture: l'industrie abandonne le discours du robot généraliste au profit d'applications verticales précises. Kepler Robotics présente un robot barista, Star Dynamics du picking sur ligne d'assemblage, YouiBot de la récupération de pièces en usine, et Leju simule une supérette pour des tâches de commerce de détail. Plusieurs de ces machines renoncent même à la forme humanoïde complète, remplaçant des mains dextres par des pinces ou des jambes par des bases à roues: la fonction prime sur l'imitation anthropomorphique, ce qui contredit l'idée d'un design universel unique vers lequel convergerait le secteur. Cette évolution s'inscrit dans une phase de maturation après plusieurs années dominées par des démonstrations spectaculaires mais peu représentatives des conditions réelles d'usage. Le quatrième changement observé au WAIC 2026 est justement ce déplacement de l'innovation visible vers l'infrastructure invisible: modèles, données d'entraînement, capteurs tactiles et pipelines d'apprentissage progressent davantage que les figures chorégraphiées mises en avant sur les réseaux sociaux. Le secteur atteint un équilibre provisoire qui porte en germe une différenciation plus marquée: les entreprises capables de garantir fiabilité d'exécution, sécurité et coûts de fabrication maîtrisés devraient se démarquer, tandis que celles reposant uniquement sur la performance motrice risquent la banalisation. La question centrale du salon n'est plus de savoir si les robots savent bouger, mais s'ils savent travailler.

Chine/AsieOpinion

1 source

60Robot Magazine FR

Robotique : les véritables gagnants seront-ils les fournisseurs de composants ?

Pendant que les projecteurs se braquent sur Tesla, Figure AI, Unitree ou Agility Robotics, une note d'analyse de Morgan Stanley déplace le regard vers les fournisseurs de composants qui équiperont ces machines, quel que soit le vainqueur de la course aux humanoïdes. Son argument central repose sur les roulements de précision : un drone en embarque plusieurs, un robot industriel classique plusieurs dizaines, et un robot humanoïde avancé peut en intégrer plus de 70, répartis dans les épaules, coudes, poignets, hanches, genoux, chevilles et actionneurs des mains. À cette liste s'ajoutent les réducteurs harmoniques, les actionneurs électromécaniques, les moteurs couple, les vis à billes, les encodeurs absolus, les capteurs de force et de couple, les caméras industrielles et les semi-conducteurs spécialisés pour l'IA embarquée, autant de briques technologiques difficilement substituables. La note cite plusieurs industriels européens déjà positionnés sur ce segment : SKF, Schaeffler, THK Europe, Bosch Rexroth et SEW-Eurodrive, tous dotés d'une expertise reconnue en mécanique de précision. Pour les intégrateurs et les décideurs industriels, cette lecture déplace le centre de gravité de la valeur. Plutôt que de parier sur tel constructeur de robot humanoïde, dont la viabilité commerciale reste incertaine, l'analyse invite à regarder les fournisseurs dont les pièces équiperont l'ensemble du marché, indépendamment de l'issue de la compétition entre marques. L'analogie avec les vendeurs de pelles de la ruée vers l'or, ou avec NVIDIA, TSMC et ASML dans la vague IA, reprend une thèse d'investissement classique : dans une phase de compétition ouverte entre nombreux acteurs finaux, ce sont souvent les fournisseurs d'infrastructures qui captent une valeur récurrente et moins risquée. Plus les robots gagnent en dextérité, mains et poignets multi-axes en tête, plus la densité de composants de haute précision par machine augmente, ce qui suggère un marché de composants croissant plus vite, et de façon plus prévisible, que celui des robots finis eux-mêmes. Cette lecture s'inscrit dans un débat plus large sur la souveraineté industrielle européenne. Les tensions récentes sur les semi-conducteurs ont déjà montré les risques d'une dépendance excessive envers un nombre restreint de fournisseurs étrangers pour des composants jugés stratégiques. Dans la robotique, le même schéma pourrait se reproduire : roulements, réducteurs et actionneurs sont indispensables mais restent largement absents des radars politiques, à l'inverse des robots eux-mêmes qui concentrent l'attention médiatique et les annonces spectaculaires. Le maintien d'une base industrielle dans ces composants, portée par des groupes déjà implantés comme SKF ou Schaeffler, est présenté comme un levier de compétitivité pour l'Europe face à la croissance attendue des marchés de la robotique industrielle, logistique, médicale et humanoïde dans la décennie à venir. Reste à voir si ces acteurs traditionnels sauront monter en cadence assez vite pour répondre à des spécifications inédites, notamment pour les mains et poignets multi-DOF des humanoïdes.

UEPlusieurs industriels europeens (SKF, Schaeffler, THK Europe, Bosch Rexroth, SEW-Eurodrive) sont deja positionnes sur le marche des composants de precision pour humanoides, ce qui souleve un enjeu de souverainete industrielle pour l'UE face a la dependance aux fournisseurs etrangers.

FR/EU ecosystemeOpinion

1 source

61arXiv cs.RO

Sécurisation de l'exécution de politiques RL par contrainte CBF-QP basée sur l'accélération pour des déploiements robotiques réels

Une équipe de recherche présente Acc-CBF-QP, un filtre de sécurité formulé comme un programme quadratique (QP) basé sur l'accélération et des fonctions de barrière de contrôle (CBF), destiné à contraindre en temps réel n'importe quelle politique d'apprentissage par renforcement (RL) sans toucher à son entraînement. Le système impose simultanément des limites de position articulaire, de vitesse, de couple et d'évitement de collision dans un seul cadre d'optimisation. Sa contribution centrale réside dans deux nouvelles tâches RL+QP : TorqueTask, qui minimise l'écart de couple par rapport à la commande RL, et Forward Dynamics Task, qui minimise l'écart d'accélération induite, permettant d'arbitrer finement entre sécurité et performance. La méthode a été validée en simulation et sur matériel réel, sur un bras manipulateur Kinova Gen3 à 7 degrés de liberté et sur l'humanoïde Unitree H1 à 19 degrés de liberté. Sur H1 en conditions réelles, une politique Safe-RL seule produisait 10,04 violations de contraintes par seconde ; ajoutée à Acc-CBF-QP, ce taux chute de 92%, à 0,80 violation par seconde. Sur le Kinova Gen3, les violations sont totalement éliminées. Le pipeline complet est publié en open source. L'enjeu dépasse la simple métrique de sécurité : le RL peine à passer du laboratoire au terrain précisément parce qu'il ne fournit aucune garantie formelle face aux états hors distribution, un problème critique pour des robots à pattes ou des manipulateurs opérant près de leurs limites physiques. En montrant que ce filtre préserve les performances nominales de la tâche RL dans les régimes sans violation, et qu'il évite même les arrêts d'urgence déclenchés par des dépassements de contrainte lors de commandes de vitesse agressives sur H1 (donc une durée de fonctionnement prolongée), les auteurs répondent directement à un frein connu à l'adoption industrielle : la difficulté de certifier des comportements appris pour un déploiement en sécurité sur du matériel réel. Ce travail s'inscrit dans la lignée des fonctions de barrière de contrôle, un outil de sécurité formelle de plus en plus combiné au RL et au Safe-RL pour compenser l'absence de garanties intrinsèques de ces politiques. Contrairement à des approches qui modifient l'entraînement lui-même, Acc-CBF-QP agit en aval, comme une couche de filtrage appliquée à l'exécution, ce qui facilite son adoption sur des politiques déjà entraînées. La publication du code laisse entrevoir une adoption possible par d'autres équipes travaillant sur l'humanoïde ou la manipulation, sans qu'aucun calendrier de déploiement industriel ne soit pour l'instant annoncé.

RecherchePaper

1 source

62arXiv cs.RO

Le paradoxe de l'accélération : repenser le compromis vitesse-qualité à l'inférence dans les tâches incarnées

Des chercheurs ont déposé fin juin 2026 sur arXiv (réf. 2606.28529) une étude qui remet en question une hypothèse centrale de l'optimisation des modèles robotiques de fondation : supposer qu'une latence d'inférence réduite par pas d'action améliore mécaniquement les performances à l'échelle de la tâche. Le papier introduit TISED (Task-level Inference Speedup Effect Decomposition), un cadre analytique unifiant les techniques "avec perte" couramment appliquées aux modèles embarqués, notamment la quantization, l'élagage (pruning) et l'inférence asynchrone. L'étude documente trois paradoxes sur deux familles de tâches : sur les tâches statiques, l'optimisation peut allonger le temps d'exécution total même quand la latence par action diminue ; sur les tâches dynamiques, une compression modérée peut faire monter le taux de succès au-dessus de la ligne de base non-optimisée ; et l'emplacement du point d'équilibre optimal dépend de la configuration matérielle du robot. Ce résultat interroge directement les équipes déployant des VLA (Vision-Language-Action) en production, qu'il s'agisse de bras manipulateurs en usine ou de robots humanoïdes en entrepôt. L'industrie a massivement adopté la quantization et le pruning en supposant un arbitrage simple : un peu de qualité d'action contre une réduction de latence et de coût de calcul. TISED montre que ce compromis est trompeur. Sur les tâches statiques à longues séquences, la dégradation par pas s'accumule et peut effacer le gain de vitesse global. Sur les tâches dynamiques, la boucle fermée propre à l'exécution robotique crée des dynamiques que les benchmarks statiques ne capturent pas, ce qui explique pourquoi un modèle légèrement compressé peut paradoxalement mieux performer en répondant plus fréquemment à l'environnement. Ce travail s'inscrit dans la course à l'inférence rapide portée par des modèles comme pi-0 de Physical Intelligence, GR00T N2 de NVIDIA et Helix de Figure AI, tous contraints à tourner sur du matériel embarqué limité. L'enjeu est particulièrement critique pour les acteurs qui visent un déploiement à grande échelle, comme Figure AI dans ses usines BMW, ou les plateformes AMR européennes comme Exotec. TISED reste à ce stade un preprint non évalué par les pairs, sans validation publiée sur du matériel physique ; les prochaines étapes naturelles seraient une confrontation avec des benchmarks standard comme RoboMimic ou Calvin, et des tests sur des plateformes réelles comme Unitree ou Franka.

UELes plateformes AMR européennes comme Exotec, qui déploient ou évaluent des systèmes VLA embarqués, devront réévaluer leurs hypothèses d'optimisation d'inférence (quantization, pruning) à la lumière des paradoxes documentés par TISED avant tout déploiement à grande échelle.

RechercheOpinion

1 source

63Interesting Engineering

Chine : les robots Agibot atteignent 99 % de réussite lors d'une démonstration en usine de six jours

AGIBOT, fabricant chinois de robots humanoïdes, a organisé fin juin 2026 un livestream mondial de six jours depuis l'usine Longcheer Technology de Nanchang, en Chine, pour démontrer la viabilité industrielle de ses robots G2 sur une ligne de production active. Les G2 sont des manipulateurs mobiles sur roues avec un torse humanoïde, conçus pour la manutention, l'inspection qualité et l'assistance en ligne de fabrication. Pendant 64 heures d'opération cumulées, les robots ont exécuté 64 828 tâches réparties sur plus de quatre flux de fabrication différents, avec un taux de réussite annoncé de 99,99 %. Ils ont contribué à la production de 17 625 unités de tablettes en conditions réelles, aux côtés d'opérateurs humains et d'équipements industriels en fonctionnement. Simultanément, AGIBOT a annoncé la livraison de son 15 000e robot à Longcheer, soulignant une montée en cadence remarquable : il a fallu environ un an pour passer de 1 000 à 5 000 unités, puis seulement trois mois pour aller de 5 000 à 10 000, soit une vitesse de production multipliée par quatre. Le demo-to-reality gap reste l'obstacle central du secteur humanoïde, et AGIBOT a structuré son exercice précisément pour répondre à cette critique. Un livestream continu de six jours sur une ligne de production commerciale non préparée est méthodologiquement plus contraignant qu'une démonstration en laboratoire ou une vidéo sélectionnée. Cela dit, un taux de succès de 99,99 % sans indication du nombre d'interventions humaines, du périmètre exact des tâches ou de la nature des "failures" non comptabilisées mérite prudence. Si les chiffres se confirment à l'audit, ils représentent un signal fort pour les intégrateurs industriels : le sim-to-real et la robustesse en environnement bruité commencent à être résolus à une échelle suffisante pour envisager des déploiements pilotes à coût acceptable. La position déclarée d'AGIBOT dans les expéditions mondiales d'humanoïdes, à 39 % de part de marché selon ses propres chiffres, illustre l'avance de l'écosystème chinois dans la commercialisation de masse, bien avant que des acteurs occidentaux comme Figure AI, Agility Robotics ou 1X n'aient franchi les mêmes seuils de volume. Fondée à Shanghai, AGIBOT a accéléré son développement dans le sillage du boom des VLA (Vision-Language-Action models) et de l'intérêt industriel post-2023 pour l'embodied AI. Son G2 concurrence directement le Figure 03 (Figure AI, ayant réalisé un run autonome de 200 heures en mai 2026 avec 250 000 colis traités) et l'Optimus Gen 3 de Tesla, ainsi que les robots Unitree et Fourier Intelligence côté chinois. Sur le segment européen, les acteurs comme Enchanted Tools ou Wandercraft restent positionnés sur des niches spécialisées (service, médical) sans viser encore la production industrielle de masse. La prochaine étape pour AGIBOT sera de convertir ces démonstrations en contrats de déploiement multi-sites et de publier des données indépendantes validant ses métriques de fiabilité.

UEAucun impact direct sur la France/UE, mais la démonstration révèle un écart compétitif croissant : avec 15 000 robots livrés et 39 % de parts de marché revendiquées, l'écosystème chinois distance les acteurs européens (Enchanted Tools, Wandercraft) qui restent cantonnés à des niches spécialisées sans viser la production industrielle de masse.

Chine/AsieOpinion

1 source

64Pandaily

X Square Robot boucle quatre levées consécutives et atteint 2,8 milliards de dollars de valorisation grâce à ses modèles fondation d'IA physique

X Square Robot, startup pékinoise fondée en 2023 et spécialisée dans l'IA incarnée pour environnements réels, vient de boucler quatre tours de financement consécutifs dont une Série C portant sa valorisation à 2,8 milliards de dollars (20 milliards de yuans). IDG Capital a participé à la Série C, tandis que HongShan et Xiaomi ont soutenu l'entreprise sur plusieurs tours antérieurs. Surtout, Meituan, Alibaba et ByteDance ont chacun conduit un tour précédent, faisant de X Square Robot la seule société d'IA incarnée en Chine à avoir obtenu un lead investment des quatre plus grands groupes tech nationaux. En avril 2026, la société a dévoilé WALL-B, un modèle fondation basé sur son architecture "World Unified Model" (WUM) : contrairement aux approches VLA modulaires qui assemblent des composants vision, langage et action distincts, WALL-B entraîne l'ensemble perception-langage-action-prédiction physique dans un réseau unique. Deux modèles complémentaires ont été mis en open source : WALL-OSS-0.5, qui atteint plus de 80 % de complétion autonome sur 4 des 17 tâches testées en conditions réelles sans fine-tuning post-entraînement, et WALL-WM, un modèle de prédiction monde alignant données langagières, visuelles et gestuelles autour d'événements physiques significatifs. Sur le terrain, X Square Robot a déployé ses robots en partenariat avec 58.com pour un service de nettoyage assisté par IA à Shenzhen et Pékin, les machines opérant aux côtés d'agents humains dans des immeubles résidentiels réels. Depuis mai 2026, un programme "X Family Member" place des robots en foyers volontaires jusqu'à un mois en tant qu'assistants domestiques. La valorisation à 2,8 milliards de dollars positionne X Square Robot parmi les startups d'IA incarnée les mieux capitalisées de Chine, dans une course mondiale où Figure AI, Physical Intelligence et Agility Robotics mobilisent des montants comparables aux États-Unis. L'architecture unifiée de WALL-B constitue un pari architectural distinct des approches modulaires dominantes comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. Le score de 80 % sur 4 tâches sélectionnées parmi 17 sans post-training est encourageant, mais l'échantillon invite à la prudence : les 13 tâches restantes ne sont pas documentées, ce qui laisse le demo-to-reality gap partiellement ouvert. Les déploiements effectifs chez 58.com et en appartements résidentiels donnent néanmoins plus de crédit à ces métriques que les démonstrations habituelles en laboratoire contrôlé. Fondée en 2023, X Square Robot s'inscrit dans un écosystème chinois de robotique humanoïde incluant Unitree Robotics, Fourier Intelligence et AgiBot, face aux acteurs américains Figure AI (valorisé 2,6 Md$ fin 2024), Boston Dynamics et Physical Intelligence. La présence simultanée de Meituan, Alibaba et ByteDance au capital signale des débouchés ciblés dans la logistique, la livraison et les services à domicile, secteurs que ces groupes cherchent activement à automatiser. La mise en open source de WALL-OSS-0.5 et WALL-WM suit une stratégie classique d'adoption académique et industrielle avant commercialisation. Les fonds levés seront alloués au développement technologique core et à la recherche fondamentale en intelligence incarnée, avec pour horizon déclaré des systèmes robotiques polyvalents capables d'opérer dans des environnements non structurés du quotidien.

UELes modèles WALL-OSS-0.5 et WALL-WM étant open source, les équipes R&D européennes peuvent les évaluer directement ; la montée en puissance de l'écosystème chinois (Alibaba, ByteDance, Meituan comme investisseurs lead simultanés) intensifie la pression concurrentielle sur les acteurs européens de l'IA incarnée.

Chine/AsieOpinion

1 source

65Robotics Business Review

Nous savons construire des robots plus intelligents, il reste à apprendre à mieux les tester

Un robot humanoïde est aujourd'hui accessible à l'achat pour 14 000 dollars, sans certification de sécurité standardisée ni protocole de validation comportementale obligatoire. L'auteur de cet article, chercheur en robotique, a co-publié deux travaux récents qui convergent vers un même constat : les méthodologies de test n'évoluent pas au même rythme que les architectures de contrôle autonome. Pour cartographier ce décalage, il propose une taxonomie en cinq niveaux, classifiant les robots non pas selon le degré d'attention humaine (comme le fait la norme SAE pour les véhicules), mais selon le mode de traitement de l'information et de génération du comportement par la machine elle-même. Niveau 0 : téléopération pure. Niveau 1 : imitation par behavior cloning, fragile dès que les conditions terrain s'écartent légèrement des données d'entraînement. Niveau 2 : apprentissage supervisé en temps réel, où le robot détecte son incertitude, se met en pause et intègre une correction humaine via inverse reinforcement learning. Niveau 3 : apprentissage auto-supervisé, le robot générant ses propres signaux d'entraînement par essais-erreurs sans intervention humaine. Niveau 4 : reinforcement learning complet, le robot reformulant chaque tâche comme un problème d'optimisation résolu en interaction continue avec son environnement. Ce que cette taxonomie révèle est structurellement important pour les intégrateurs et les décideurs industriels : chaque niveau supplémentaire introduit un type de défaillance fondamentalement différent, qui rend les approches de test existantes insuffisantes. Aux niveaux 0 et 1, les outils sont matures et les comportements testables de façon exhaustive. Dès le niveau 2, il faut valider non seulement le comportement mais aussi le mécanisme de détection d'incertitude et l'intégrité de chaque mise à jour d'apprentissage. Au niveau 3, le robot réécrit continuellement sa propre politique : tester une performance instantanée ne suffit plus, il faut auditer le processus d'apprentissage lui-même. Au niveau 4, l'espace comportemental est trop vaste et trop dynamique pour une énumération exhaustive des cas de test. La thèse centrale est que les garanties formelles de sécurité doivent remplacer l'énumération de cas tests aux niveaux élevés d'autonomie, et que l'évaluation de robustesse adversariale doit devenir aussi systématique que les tests fonctionnels. Cette réflexion s'inscrit dans un moment charnière de l'industrie : les laboratoires et industriels (Figure, Boston Dynamics, Agility, 1X, Unitree côté hardware ; Physical Intelligence, DeepMind, NVIDIA côté fondations VLA) poussent vers une autonomie croissante, mais le cadre réglementaire reste absent pour les systèmes à prise de décision autonome en environnement non contrôlé. L'absence de standards équivalents aux normes ISO 10218 pour les robots industriels fixes crée un vide que comblent actuellement les constructeurs eux-mêmes, avec des métriques internes difficiles à auditer. Les prochaines étapes identifiées par l'auteur pointent vers l'intégration de méthodes de vérification formelle et de red-teaming adversarial comme pratiques standard de validation, avant que des déploiements à grande échelle dans des environnements non structurés ne rendent ces lacunes coûteuses.

UELe vide réglementaire identifié, absence de normes équivalentes aux ISO 10218 pour les robots à décision autonome, concerne directement le marché européen, où l'AI Act devra s'appliquer à des systèmes dont les méthodes de validation restent aujourd'hui définies unilatéralement par les constructeurs.

RechercheOpinion

1 source

6636Kr

Main dextérique de Zhiyuan : 1 milliard de dollars, déjà rentable en 5 mois ; DeepSeek double ses départements

Le 26 juin 2026, deux opérations de financement majeures ont marqué l'écosystème de la robotique incarnée en Chine. Critical Point (临界点), spécialiste des mains dextres pour robots humanoïdes issue d'un spin-off de Zhiyuan Robotics (智元) en janvier 2026, a bouclé une levée proche du milliard de RMB, atteignant une valorisation d'un milliard de dollars en cinq mois d'existence seulement, soit quatre tours de table successifs avec Baidu, Hillhouse Capital et Lanchi Ventures au capital. La société revendique en outre un premier trimestre rentable depuis sa création, sans toutefois publier de comptes détaillés. Dans le même temps, Wujie Dongli (无界动力), positionnée sur les cerveaux généraux pour robots incarnés (embodied general AI), a annoncé un tour d'amorçage supérieur à 200 millions de dollars, co-mené par le fonds lié à JD.com, C Capital et Hongyi Investment, avec Sequoia China et Linear Capital en suivi. Une troisième société, Shengdu Jizhi (深度机智), a simultanément clos un tour de plusieurs centaines de millions de RMB, mené par le fonds China Life Yangtze Delta. Ces levées surviennent dans un contexte de croissance sectorielle soutenue : le marché chinois de la robotique incarnée a atteint 915 milliards de RMB (environ 125 milliards de dollars) en 2025 et devrait franchir 1 090 milliards de RMB en 2026, selon les données présentées au Link Expo 2026. Plus de 10 000 entreprises sont désormais actives dans le secteur en Chine. Le cas Critical Point illustre une tendance de fond, celle de la spécialisation de sous-systèmes robotiques (actionneurs dextres, vision, planification de trajectoire) en entités autonomes, par opposition aux approches full-stack de Figure AI, Tesla Optimus ou 1X Technologies. La rentabilité annoncée dès le premier trimestre, si elle se confirme, indiquerait une demande B2B réelle en composants dextres, mais l'absence de données financières publiques invite à la prudence. Zhiyuan Robotics, dont est issue Critical Point, figure parmi les acteurs les mieux financés de la robotique humanoïde en Chine, aux côtés d'Unitree et d'UBTECH. La stratégie de spin-off de sous-systèmes rejoint une tendance observable dans l'écosystème occidental, notamment chez Apptronik. Par ailleurs, DeepSeek a annoncé le 25 juin son intention de doubler au minimum la taille de tous ses départements, avec de multiples offres d'emploi publiées simultanément, signe que le laboratoire entend capitaliser sur la dynamique de ses modèles R1 et V3 pour construire une infrastructure de recherche à long terme. Wujie Dongli a précisé que les fonds levés seront alloués au développement d'un cerveau général incarné et à une livraison à l'échelle mondiale, sans communiquer de calendrier de déploiement ni de site client précis.

Chine/AsieActu

1 source

67arXiv cs.RO

Apprentissage de contrôleurs de locomotion perceptifs et adaptatifs pour robots quadrupèdes

Une équipe de chercheurs a publié le 25 juin 2026 sur arXiv (2606.25179) une étude portant sur la conception de contrôleurs de locomotion universels pour robots quadrupèdes, capables de s'adapter à plusieurs morphologies de robots différents tout en intégrant de la perception en temps réel. Les auteurs s'appuient sur le cadre MorAL (Morphology-Aware Locomotion), qu'ils étendent en comparant trois architectures : un contrôleur aveugle (baseline sans perception), MorAL+ (perception intégrée uniquement dans le critique du réseau, pas dans l'acteur), et PPAL (acteur-critique entièrement perceptif). Les politiques ont été évaluées en simulation sur terrains plats et accidentés, puis déployées sur du matériel réel via le robot ANYmal d'ANYbotics. Résultat principal : MorAL+ surpasse les deux autres configurations en robustesse et en cohérence de suivi de trajectoire, notamment parce qu'un acteur entièrement perceptif se révèle sensible au bruit de capteur, tandis qu'un acteur aveugle manque de conscience du terrain. Ce résultat va à contre-courant d'une intuition répandue dans la communauté robotique : intégrer plus de perception n'est pas toujours meilleur. Le fait que la perception placée uniquement dans le critique (et non dans l'acteur) améliore la robustesse sans fragiliser la politique face au bruit de capteur est une contribution architecturale concrète. Pour les intégrateurs industriels qui déploient des quadrupèdes en environnements non structurés (entrepôts, sites industriels, inspection d'infrastructures), cette distinction a des implications directes sur la conception des pipelines de contrôle. Elle indique aussi que le problème du sim-to-real pour la locomotion quadrupède n'est pas uniquement une question de quantité de données perceptives, mais de leur positionnement dans l'architecture d'apprentissage par renforcement. ANYmal, développé par ANYbotics (spin-off de l'ETH Zurich), est l'un des robots quadrupèdes les plus utilisés en recherche académique et en déploiements industriels pilotes, aux côtés de Spot de Boston Dynamics et des modèles Unitree (Go2, B2) qui dominent le segment prix bas. Le cadre MorAL, sur lequel s'appuie ce travail, visait déjà à entraîner des politiques transférables entre morphologies de robots différents, un problème ouvert dans la course à la généralisation inter-robots (cross-embodiment). Ce papier reste pour l'instant un preprint académique sans déploiement industriel annoncé ; les suites naturelles seraient une validation sur un ensemble plus large de morphologies quadrupèdes et des tests en conditions réelles prolongées, en dehors du cadre contrôlé d'un labo.

UEANYbotics étant un spin-off suisse de l'ETH Zurich, les conclusions architecturales sur MorAL+ intéressent directement les intégrateurs européens qui déploient des quadrupèdes en inspection industrielle ou en environnements non structurés.

RecherchePaper

1 source

68Interesting Engineering

Vidéo : un chien robot effectue 33 000 inspections dans une cimenterie vieille de 150 ans

Depuis début 2025, le robot quadrupède ANYmal d'ANYbotics est déployé en exploitation nocturne autonome à l'usine de ciment Vigier Ciment en Suisse, un site vieux de 150 ans abritant plus de 1 000 machines réparties sur six niveaux et trois unités de broyage. En seize mois d'exploitation, l'ANYmal a réalisé plus de 33 000 inspections couvrant 450 points de contrôle prédéfinis, sans intervention humaine. Pesant 50 kilogrammes, le robot embarque une caméra haute résolution pour la détection visuelle d'anomalies structurelles, une caméra thermique pour le suivi des températures sur roulements, moteurs et engrenages, un capteur de gaz mesurant les taux d'ammoniac, et un imageur acoustique capable de localiser des fuites d'air comprimé jusqu'à 50 mètres de distance. Ces capteurs ont permis quatre découvertes documentées : une fissure dans la fondation d'un concasseur détectée avant qu'elle ne provoque un arrêt estimé à 630 000 dollars de production perdue ; une montée en température d'un roulement vers 140 °C interceptée grâce à une réparation planifiée de huit heures ; des niveaux d'exposition à l'ammoniac identifiés dans des zones de déchargement jusque-là non mesurées ; et des fuites d'air dans des systèmes de filtration à cinquante mètres du sol localisées par imagerie acoustique. Ce déploiement constitue l'un des rares cas industriels documentés où un robot mobile autonome dépasse les 30 000 cycles opérationnels sans panne mécanique sur un site de production actif. Pour les responsables maintenance et les décideurs B2B, c'est moins la technologie embarquée qui retient l'attention que le modèle économique : ANYbotics affirme que l'ANYmal a récupéré plus que le coût total du programme sur la période, sans chiffrer précisément ce ratio. La capacité à détecter en amont des défaillances sur équipements rotatifs (roulements surchauffés, fondations fissurées) transforme l'inspection robotisée d'un outil de conformité HSE en levier direct de continuité de production. L'argument tient particulièrement pour les environnements à fort risque HSE et forte contrainte de disponibilité : chimie, ciment, pétrochimie, fonderies. L'ANYmal opère également les nuits et week-ends, intervalles que les rondes manuelles couvrent rarement, ce qui augmente structurellement la fréquence de détection des dérives thermiques ou mécaniques. ANYbotics est un spin-off de l'ETH Zurich fondé en 2016 ; le robot ANYmal y est développé depuis les premiers travaux du Robotic Systems Lab, publiés dès 2014. Les données collectées lors des patrouilles sont agrégées dans la plateforme logicielle Data Navigator d'ANYbotics. Sur ce segment de l'inspection robotique industrielle quadrupède, le principal concurrent est Boston Dynamics avec Spot, déployé chez des groupes pétroliers et chimiques comme BP, Aker BP ou BASF ; Ghost Robotics (États-Unis) et Unitree (Chine) sont également présents, mais avec peu de références industrielles lourdes en Europe. En France, aucun acteur comparable n'opère sur ce créneau spécifique, même si Exotec (AMR logistique) et Enchanted Tools (manipulation collaborative) adressent des niches adjacentes. Aucun calendrier d'extension du déploiement Vigier à d'autres sites n'a été officiellement annoncé.

UECe retour d'expérience suisse, avec métriques documentées sur 16 mois, constitue une référence exploitable pour les opérateurs industriels européens (ciment, chimie, pétrochimie) qui évaluent le ROI de l'inspection quadrupède autonome face à Boston Dynamics Spot.

IndustrielOpinion

1 source

69Robot Magazine FR

VivaTech 2026 : l’année où les robots humanoïdes sont devenus une réalité industrielle

Les 17 et 18 juin 2026, la dixième édition de VivaTech à Paris Porte de Versailles a réuni des dizaines de démonstrations de robots humanoïdes capables de marcher, manipuler des objets et interagir avec des opérateurs humains. L'événement s'est distingué des éditions précédentes par la présence notable d'acteurs chinois en nombre, venus exposer leurs avancées en « Embodied AI », la convergence entre modèles de raisonnement LLM et corps robotiques physiques. Parmi les machines les plus remarquées figurait KANGAROO, développé par PAL Robotics (Barcelone) en partenariat avec plusieurs centres de recherche européens : un humanoïde à mobilité avancée, entraîné par renforcement, positionné comme plateforme industrielle et logistique polyvalente. L'article ne fournit pas de spécifications techniques précises (charge utile, degrés de liberté, temps de cycle) ni de confirmation de déploiement commerciaux signés, les présentations restaient majoritairement au stade de démonstrations salon. Ce moment marque une inflexion rhétorique autant que technique : depuis ChatGPT en 2022, l'IA était associée aux assistants logiciels ; VivaTech 2026 a déplacé le centre de gravité vers l'IA physique. Pour les intégrateurs et décideurs industriels, le signal le plus structurant est la montée en puissance de la Chine sur le segment humanoïde, un marché qu'elle dominait déjà en volumes sur les bras industriels classiques. Pékin traite désormais la robotique humanoïde comme secteur stratégique au même titre que les semi-conducteurs, avec une logique de mise à l'échelle rapide et de compression des coûts qui change la donne compétitive. Pour les acheteurs B2B européens, la question n'est plus seulement « quelle plateforme est la plus capable » mais « laquelle peut être produite en volumes suffisants à un prix d'entrée industriel ». La trajectoire rappelle celle des véhicules électriques : l'Europe dispose de l'ingénierie, la Chine de la capacité de production. PAL Robotics, fondée en 2004 à Barcelone et pionnière de l'humanoïde de recherche avec REEM puis TALOS, représente l'une des rares maisons européennes avec une expérience longue sur les plateformes bipèdes. KANGAROO s'inscrit dans une stratégie de positionnement pragmatique face aux offres américaines (Figure, Apptronik, Tesla Optimus) et chinoises (Unitree, Fourier, UBTECH), en visant des environnements industriels structurés plutôt que des cas d'usage grand public. Les suites annoncées restent vagues : aucun calendrier de commercialisation ni volume de déploiement n'est mentionné dans l'article source. L'édition 2026 confirme que la course à l'humanoïde industriel est désormais ouverte et multipolaire, mais la majorité des acteurs en sont encore à la phase démonstration-salon, pas à la livraison cliente à l'échelle.

UEPAL Robotics (Barcelone) positionne KANGAROO comme plateforme humanoïde industrielle européenne lors de VivaTech Paris, mais l'Europe reste structurellement exposée à la montée en puissance chinoise sur les volumes et la compression des coûts, un risque compétitif direct pour les intégrateurs industriels français et européens.

FR/EU ecosystemeOpinion

1 source

70arXiv cs.RO

La configuration des capteurs est déterminante : une évaluation systématique du SLAM multimodal sur des robots quadrupèdes

Des chercheurs publient sur arXiv (réf. 2606.19067) une évaluation systématique de méthodes SLAM (Simultaneous Localization and Mapping) appliquées aux robots quadrupèdes, en s'appuyant sur le dataset GrandTour enregistré sur un ANYmal D d'ANYbotics. Trois familles d'approches sont comparées : SLAM visuel pur, visuel-inertiel (VIO), et LiDAR-visuel-inertiel. L'étude isole trois variables matérielles : modalité caméra (monoculaire, stéréo, RGB-D), type d'obturateur (global shutter vs rolling shutter), et qualité de l'IMU. Résultats principaux : les configurations stéréo surpassent systématiquement le monoculaire et le RGB-D en précision de localisation ; les caméras à obturateur global réduisent significativement les échecs de tracking liés au mouvement ; et, point contre-intuitif, l'intégration d'une IMU standard peut dégrader les performances des frameworks principalement visuels sous les dynamiques agressives de la locomotion quadrupède. Les robots à pattes génèrent des perturbations sensorielles que les plateformes à roues ou les drones ne produisent pas à la même intensité : chocs d'impact au sol à chaque appui, vibrations mécaniques haute fréquence dans la structure, rotations angulaires rapides lors des corrections de posture. Ces phénomènes dégradent les pipelines de perception conçus pour des dynamiques plus lisses. L'enseignement clé pour les intégrateurs : le choix matériel conditionne la robustesse avant même le choix algorithmique. Que l'IMU standard puisse activement nuire à la perception visuelle, plutôt que simplement ne pas l'améliorer, remet en question la pratique courante d'ajouter une centrale inertielle bas de gamme par défaut dans un payload. Pour un responsable technique évaluant un quadrupède pour l'inspection d'infrastructure, l'étude fournit des critères de sélection hardware directement actionnables. L'ANYmal D, développé par ANYbotics (spin-off de l'ETH Zurich), est l'une des plateformes quadrupèdes les plus déployées en inspection industrielle, notamment dans le secteur pétrolier et gazier. Le SLAM visuel-inertiel a été largement validé sur drones et robots à roues, mais sa transposition aux systèmes à pattes reste un chantier de recherche actif. Les équipes travaillant sur Boston Dynamics Spot, Unitree B2 ou les plateformes d'Agility Robotics affrontent les mêmes contraintes d'embodiment. L'article formule des recommandations concrètes pour la constitution de payloads capteurs sur systèmes agiles, directement exploitables par les intégrateurs définissant les prochaines itérations de ces plateformes.

UELes critères de sélection hardware identifiés (stéréo + obturateur global, méfiance envers IMU bas de gamme) bénéficient directement aux intégrateurs européens déployant des quadrupèdes ANYmal D (ANYbotics, spin-off ETH Zurich) sur des sites d'inspection industrielle en Europe.

RecherchePaper

1 source

71Pandaily

Alibaba et ByteDance redoublent d'efforts sur l'IA incarnée : l'apport des géants d'internet à la robotique

Le 16 juin 2026, Alibaba a lancé Qwen-Robot, sa première famille complète de modèles d'IA incarnée intégrée à la série Qwen. Elle regroupe trois composants distincts : Qwen-RobotManip pour la manipulation physique, Qwen-RobotNav pour la navigation autonome, et Qwen-RobotWorld comme modèle de monde, c'est-à-dire un moteur de raisonnement contextuel sur l'environnement physique. Ces modules peuvent être déployés séparément ou en coordination, selon le type de robot ciblé. Le positionnement d'Alibaba est explicitement logiciel : l'entreprise ne vise pas à construire des corps robotiques, mais à fournir le "cerveau intelligent" à des fabricants tiers. Simultanément, ByteDance a réorganisé ses efforts en robotique incarnée en élevant Seed Robotics au rang de division stratégique principale, désormais sous la supervision de Zhou Chang, responsable multi-modal du groupe. ByteDance a déjà produit plus de 1 000 robots, majoritairement des robots mobiles à roues pour la logistique en entrepôt et en usine, et compte parmi ses clients externes SF Express et BYD Electronics. Ce double mouvement illustre un changement structurel dans la course aux humanoïdes et à la robotique généraliste : les géants de l'internet entrent dans le secteur non par la mécanique, mais par la donnée et l'intelligence. La valeur qu'ils apportent repose sur trois piliers. D'abord, leurs grands modèles de langage compressent le temps d'adaptation à de nouvelles tâches : là où un ingénieur robotique traditionnel passerait plusieurs semaines à reprogrammer un bras ou un AGV pour un nouveau scénario, une approche VLA (vision-language-action) peut réduire cette itération à quelques jours. Ensuite, leur infrastructure opérationnelle génère des données d'entraînement à une échelle inaccessible aux startups : le réseau de livraison instantanée de Meituan, les entrepôts de JD Logistics, les chaînes d'approvisionnement e-commerce de ByteDance accumulent chaque jour des millions d'interactions physiques réelles. Enfin, et c'est peut-être le facteur le plus sous-estimé, ces entreprises sont leurs propres premiers clients. JD a validé ses robots logistiques dans ses propres entrepôts "Asia No.1" avant de les commercialiser. ByteDance fait circuler ses AMR sur de vraies routes opérationnelles avant de les vendre. Ce raccourci entre laboratoire et déploiement à l'échelle est ce qui manque le plus aux startups hardware-first. Pour autant, les analystes du secteur rappellent que l'avantage logiciel ne dissout pas les contraintes physiques. Les composants critiques comme les actionneurs, les capteurs de force ou les joints à haute précision restent des goulots d'étranglement de supply chain qui ne s'effacent pas parce qu'un géant tech entre dans la pièce. Alibaba et ByteDance font face à une concurrence à deux niveaux : d'un côté les acteurs hardware-first américains comme Figure AI, 1X, Boston Dynamics ou Agility Robotics qui avancent en parallèle sur la couche IA ; de l'autre les constructeurs chinois comme Unitree ou Fourier Intelligence qui maîtrisent déjà la chaîne de fabrication. La prochaine étape pour évaluer ces annonces sera de mesurer si les modèles Qwen-Robot passent l'épreuve du déploiement industriel répété en dehors des environnements contrôlés d'Alibaba, ce qui reste à ce stade une démonstration en cours, pas un produit livré.

Chine/AsieOpinion

1 source

72Interesting Engineering

Alibaba dévoile des cerveaux IA conçus pour équiper la prochaine génération de robots

Alibaba a annoncé en juin 2026 le lancement de la suite Qwen-Robot, sa première famille de modèles d'IA dite "embodied", développée par son Tongyi Lab et actuellement en phase de pilote avec des clients entreprise d'Alibaba Cloud. La suite repose sur trois modèles spécialisés : Qwen-RobotNav pour la navigation et le suivi de cibles, Qwen-RobotManip pour la manipulation d'objets physiques, et Qwen-RobotWorld pour la modélisation de l'environnement et la prédiction des conséquences d'actions. Le groupe a également publié Qwen-RobotClaw, un framework d'agents qui expose les modèles Qwen-Robot comme outils accessibles à des agents LLM, ainsi que Chat2Robot, une plateforme open-source en navigateur pour tester des interactions avec des robots physiques. Sur le plan des performances déclarées, Qwen-RobotManip a été entraîné sur plus de 38 000 heures de données open-source et a obtenu sur le benchmark RoboChallenge un process score de 59,83 avec un taux de succès de tâches de 45 % dans la catégorie "généraliste". La démonstration de navigation a mis en scène un quadrupède Unitree Go2 équipé d'un NVIDIA Jetson Thor et d'une seule caméra basse résolution, atteignant une latence d'inférence de 196 millisecondes dans un appartement inconnu, sans carte préchargée. Ces résultats méritent d'être lus avec prudence : un taux de succès de 45 % sur un benchmark réel, s'il est confirmé en conditions non contrôlées, reste modeste mais significatif pour un modèle généraliste. Le vrai signal industriel n'est pas le score brut, c'est l'approche architecturale : au lieu de fusionner indifféremment données de navigation, bras robotiques, caméras et véhicules autonomes, Alibaba a opté pour une spécialisation par modalité, évitant les conflits d'apprentissage que génère le mélange hétérogène de données physiques. Pour les intégrateurs et décideurs B2B, la disponibilité via Alibaba Cloud en pilote marque un premier pas vers la commercialisation d'une couche d'IA robotique as-a-service, potentiellement utilisable sur du matériel tiers sans pipeline de training propriétaire. Alibaba entre dans une course déjà engagée par plusieurs acteurs de premier plan. Aux États-Unis, Google DeepMind fait avancer Gemini Robotics sur des architectures Vision-Language-Action (VLA) similaires, tandis que Physical Intelligence (Pi-0), Figure AI (Figure 03) et Boston Dynamics misent sur des pipelines de données propriétaires et des déploiements industriels réels. NVIDIA pousse son framework GR00T N2 comme socle hardware-logiciel pour l'humanoid. Côté chinois, Unitree et Agibot ont déjà des robots en production, mais sans la couche LLM intégrée qu'Alibaba apporte. L'open-sourcing de Chat2Robot et les pilotes cloud suggèrent une stratégie d'écosystème : capter les développeurs et intégrateurs autour des modèles Qwen-Robot avant que le marché des robots généraux ne se consolide, probablement d'ici 2027-2028 selon les timelines annoncées par les principaux concurrents.

UEL'entrée d'Alibaba dans l'IA robotique cloud-as-a-service intensifie la pression concurrentielle mondiale, sans déploiement ni partenariat européen annoncé à ce stade.

💬 45 % de réussite sur un benchmark généraliste, c'est pas brillant, je sais, mais tu regardes au mauvais endroit. Le vrai signal, c'est l'architecture : trois modèles spécialisés par modalité plutôt qu'un gros fourre-tout, parce que mélanger navigation, manipulation et caméras dans le même pipeline, ça crée des conflits d'apprentissage que tout le monde a sous-estimés depuis le début. Alibaba ne cherche pas à gagner les benchmarks robotiques, ils cherchent à s'installer comme la couche cloud entre le matériel tiers et l'IA physique avant que le marché se consolide.

IA physiqueOpinion

1 source

73arXiv cs.RO

FARM : retrouver n'importe quel objet grâce à la mémoire spatiale relationnelle

Des chercheurs ont publié FARM (Find Anything using Relational Spatial Memory), un système de mémoire spatiale pour robots capable de localiser des objets en temps réel via des requêtes en langage naturel exprimant des relations contextuelles, du type "la grande lampe sous la cible de fléchettes et à gauche de l'affiche". Le système construit une carte sémantique compacte à 5-10 Hz intégrant géométrie, descripteurs visuels-linguistiques et indices de point de vue. Évalué sur 44 000 requêtes couvrant 67 scènes intérieures et extérieures de 15 à 15 000 m², FARM améliore le Recall@5 de 164 % et le Recall@10 de 224 % par rapport aux méthodes existantes. Une étape de réordonnancement par VLM améliore encore l'Accuracy@1 de 35 %. Le système tourne en temps réel et a été validé en boucle fermée sur un robot quadrupède fonctionnant uniquement avec capteurs et calcul embarqués. L'enjeu dépasse la simple localisation d'objet: dans des entrepôts, habitations ou espaces industriels, un robot doit résoudre des ambiguïtés entre objets similaires via des relations contextuelles, ce que les mémoires de niveau objet seul ne permettent pas. FARM structure explicitement les contraintes spatiales par des prédicats relationnels plutôt qu'en les laissant implicites dans un raisonnement end-to-end sur des historiques de frames. Pour les intégrateurs et décideurs B2B, c'est une brique critique: les robots de service, de picking ou de logistique doivent être pilotables par instruction verbale sans expertise technique. Les gains à +224 % sur Recall@10 sont significatifs, bien que les conditions précises de benchmark, scènes contrôlées ou environnements non-stagés, ne soient pas détaillées dans la publication. Ce travail se situe à l'intersection de la cartographie sémantique 3D (systèmes type ConceptFusion ou OpenScene), des graphes de scène neuronaux et des VLM multimodaux. La combinaison mémoire open-vocabulary et prédicats relationnels explicites distingue FARM des approches end-to-end qui saturent dans les scènes denses. Sur le plan concurrentiel, des acteurs comme Boston Dynamics, Unitree et des laboratoires tels que Stanford ou CMU explorent des approches similaires pour la navigation sémantique. En Europe, des projets de robots de service ou d'assistance, dont des initiatives françaises liées à l'ANR ou des spin-offs comme Enchanted Tools travaillant sur l'interaction homme-robot, pourraient directement intégrer ce type de composant. La prochaine étape décisive sera de valider FARM dans des environnements dynamiques où les objets se déplacent et les relations spatiales évoluent en continu.

UEDes projets européens de robotique de service et des acteurs comme Enchanted Tools pourraient intégrer FARM comme brique de perception sémantique, mais aucun déploiement direct en France/UE n'est confirmé à ce stade.

💬 Ce qui m'accroche, c'est pas les chiffres, c'est que le robot comprend "la lampe sous la cible de fléchettes". C'est exactement ce qui plantait tous les systèmes de mémoire objet précédents, ils encodaient les objets mais pas les relations spatiales entre eux, et c'est pourtant ce qu'on exprime naturellement quand on parle à un robot. Les +224% sur les benchmarks sont solides, bon, reste à voir si ça tient dans une vraie usine où les objets bougent en permanence.

IA physiqueOpinion

1 source

74arXiv cs.RO

Suivi binaire pour la QA spatiale et la navigation avec des modèles vision-langage ouverts

Une équipe de chercheurs publie sur arXiv (référence 2606.16902) un agent de localisation spatiale open-source baptisé BinTrack, conçu pour permettre à des robots de service de répondre à des questions du type « où puis-je trouver un pressing sur le chemin du retour ? » et de retourner une coordonnée métrique exploitable directement par les modules de navigation. Le système s'appuie sur un robot quadrupède réel déployé dans des rues publiques de Séoul pour constituer GangnamLoop, un nouveau benchmark multi-trajets en extérieur. BinTrack atteint une amélioration de précision allant jusqu'à 22,8 % par rapport aux autres implémentations open-source sur SpaceLocQA, le benchmark de référence du domaine, et égale les résultats des agents basés sur GPT-4o sur la catégorie « global », la plus difficile. Il offre par ailleurs un gain de vitesse d'inférence supérieur à 1,5x par rapport aux approches précédentes. L'intérêt principal de BinTrack pour les intégrateurs et les décideurs industriels tient à son architecture entièrement embarquée et déconnectée. Les approches existantes de Spatial Question Answering s'appuyaient sur des modèles fermés comme GPT-4o via des agents RAG (retrieval-augmented generation), ce qui implique une dépendance réseau, une latence de communication et des coûts d'API prohibitifs pour une flotte de robots en production. BinTrack remplace cela par une recherche binaire sur les segments de trajectoire entre deux repères spatiaux extraits de la requête, en exploitant l'ordre temporel du trajet. Ce faisant, le travail démontre qu'un modèle de vision-langage open-source peut rivaliser avec GPT-4o sur un benchmark spatial de référence, sans connexion cloud, une hypothèse que beaucoup dans le secteur considéraient non résolue à ce stade. GangnamLoop se distingue des benchmarks indoor habituels : il capture les mêmes lieux sous différentes conditions extérieures et croise le point de vue bas du robot quadrupède avec celui de son propriétaire humain, ce qui en fait un jeu de données plus réaliste pour la navigation piétonne en ville. La recherche spatiale embarquée reste un domaine peu exploré par rapport aux approches cloud-first ; des acteurs comme Boston Dynamics, Unitree ou les équipes robotique de Google DeepMind travaillent sur des problèmes connexes, mais rarement avec une contrainte d'inférence locale aussi explicite. Le code et les données de GangnamLoop sont disponibles publiquement sur GitHub, ce qui ouvre la voie à des évaluations indépendantes et à des intégrations dans des pipelines de navigation autonome en contexte réel.

RechercheOpinion

1 source

75SCMP Tech

L'IA et les modèles du monde : pourquoi la Chine a une longueur d'avance

Les modèles de monde ("world models") sont désormais identifiés comme la prochaine rupture technologique en intelligence artificielle, dépassant les grands modèles de langage (LLM) en leur ajoutant une capacité de simulation de l'environnement physique. Contrairement aux LLM qui traitent du texte, ces architectures apprennent les lois de la physique, la causalité et la géométrie de l'espace réel, ce qui permet d'entraîner des systèmes à intelligence incarnée (embodied AI) : robots humanoïdes, véhicules autonomes, bras industriels. La Chine a déjà déployé ces systèmes à une échelle nettement supérieure à celle des États-Unis, avec des entreprises comme Baidu Apollo (plusieurs dizaines de millions de kilomètres d'autonomie sur route réelle), Unitree et ses robots humanoïdes en production, ainsi que des modèles de monde propriétaires développés par Tencent (HunyuanWorld) et ByteDance. Cet avantage chinois est structurel autant que technologique : le cadre réglementaire y autorise des déploiements massifs en conditions réelles, là où les États-Unis maintiennent des restrictions plus strictes sur les tests d'autonomie. Pour les intégrateurs industriels et les décideurs B2B, cela signifie que le gap sim-to-real, longtemps considéré comme le principal frein à l'adoption robotique, est en train d'être résolu plus vite en Chine qu'ailleurs. Les world models permettent de générer des données synthétiques d'entraînement à partir de simulations physiquement cohérentes, réduisant drastiquement le besoin de collecte en environnement réel. Côté contexte, le concept de world model remonte aux travaux de Yann LeCun chez Meta (architecture JEPA, 2022-2024), mais sa concrétisation industrielle s'est accélérée en 2025-2026 avec l'émergence de modèles dédiés à la robotique comme Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA et les plateformes chinoises. En Europe, des acteurs comme Enchanted Tools (Paris) travaillent sur des approches similaires mais à bien plus petite échelle. La prochaine étape sera probablement la standardisation des benchmarks de world models, un domaine où le leadership de définition reste encore ouvert.

UEL'Europe accuse un retard structurel face à la Chine dans la course aux world models pour la robotique incarnée, avec seulement Enchanted Tools (Paris) identifié comme acteur actif à petite échelle, là où Pékin bénéficie d'un cadre réglementaire autorisant des déploiements massifs en conditions réelles qui accélèrent la résolution du gap sim-to-real.

Chine/AsieOpinion

1 source

76arXiv cs.RO

MPC d'impédance avec estimation des perturbations pour le contrôle de main dextérique

Des chercheurs ont soumis en juin 2026 sur arXiv (réf. 2606.14606) un cadre de contrôle baptisé Impedance MPC pour doigts robotiques dextres, actuateur-agnostique, couvrant transmissions hydrauliques, câblées, pneumatiques, à corde torsadée et série-élastiques. Un préfiltrage algébrique réduit la dynamique tendineuse à un double intégrateur à coefficients constants, dont l'inverse du coût QP est précalculé hors ligne ; un horizon glissant de 10 pas tourne à 500 Hz avec contraintes dures sur les forces de contact (ISO/TS 15066), les limites d'actionnement et le jerk. Un filtre de Kalman augmenté, alimenté uniquement par encodeurs, annule l'erreur statique sous charge constante. Sur un prototype de doigt à actionnement hydraulique, le contrôleur atteint 0,5 mrad RMS, 0,1 mrad en régime permanent et 6,6 mrad en pic sous 1,5 Nm de couple de contact, soit 183×, 1500× et 23× meilleur que l'impédance classique à gain fixe ; la raideur réalisée s'étend de 18 à 323 Nm/rad selon la fréquence de mise à jour. En simulation MuJoCo, le cadre s'étend à une main LEAP à 16 DOF, récupérant en 0,7 s après une perturbation de saisie de 2,5 N. L'actuateur-agnosticisme est le principal atout pour les intégrateurs : une seule loi de commande couvre des architectures mécaniquement très hétérogènes sans retuning, réduisant le coût d'intégration sur des plateformes multi-actionneurs. La conformité native à l'ISO/TS 15066 dans la formulation du problème simplifie les validations pour le déploiement cobotique en environnement humain, là où les forces de contact sont réglementées. Il faut cependant relativiser les gains annoncés, dont le plus élevé atteint 1500× : la référence est un contrôleur à gain fixe, choix délibérément défavorable, et des benchmarks contre du MPC adaptatif ou du contrôle par apprentissage sont absents de l'article. La main dextre reste le maillon faible de la robotique humanoïde : Shadow Robotics, Inspire Robots et d'autres ont progressé sur le plan mécanique, mais le contrôle fin sous contact demeure un problème ouvert. Les mains LEAP, issues de Carnegie Mellon, constituent la plateforme open-source de référence pour la recherche en manipulation. Les approches concurrentes privilégient l'apprentissage par renforcement et les architectures VLA (vision-langage-action), qui court-circuitent le contrôle classique au prix des garanties formelles ; cet article occupe l'angle inverse, avec des propriétés de stabilité et de faisabilité récursive héritées du cadre pHRI (interaction physique humain-robot). Aucun partenaire industriel ni calendrier de transfert n'est mentionné ; la contribution reste académique, mais elle outille directement les équipes intégrant des mains dextres sur des humanoïdes commerciaux comme ceux de Figure AI ou Unitree.

UELa conformité native à l'ISO/TS 15066 inscrite dans la formulation du contrôleur simplifie les validations réglementaires pour le déploiement cobotique en environnements humains en Europe, où les forces de contact sont normativement encadrées.

RecherchePaper

1 source

77arXiv cs.RO

Contrôle corps entier généraliste et adaptable pour la locomotion de divers humanoïdes

Des chercheurs ont publié sur arXiv (référence 2602.05791) un framework baptisé XHugWBC, conçu pour entraîner un contrôleur de locomotion whole-body universel sur une large distribution de morphologies humanoïdes, puis le déployer en zero-shot sur des robots non vus durant l'entraînement. Les expériences couvrent douze humanoïdes simulés et sept robots réels. Le système repose sur trois briques techniques : une randomisation morphologique physiquement cohérente (masse des segments, longueur des membres, inertie), des espaces d'observation et d'action alignés sémantiquement entre châssis hétérogènes, et une architecture de politique qui encode explicitement les propriétés morphologiques et dynamiques de chaque instance. L'entraînement est unique, "one-time training" : aucun fine-tuning par robot n'est requis à l'inférence. L'enjeu industriel est direct. Aujourd'hui, chaque équipe robotique entraîne ses contrôleurs de locomotion depuis zéro pour chaque châssis, ce qui représente des semaines de simulation et d'itérations sim-to-real. XHugWBC déplace ce coût vers une phase d'entraînement généraliste unique, ouvrant la voie à un modèle de déploiement où un intégrateur peut adopter un nouveau châssis humanoïde sans reconstruire l'intégralité de sa stack de contrôle. La validation sur sept robots physiques est plus convaincante que les résultats purement simulés habituels, même si la nature exacte des tâches testées et les taux de succès détaillés ne figurent pas dans le résumé disponible. La capacité de transfert zero-shot sur morphologies inédites renforce l'hypothèse que les biais structuraux appris sur distributions larges surpassent les politiques spécialisées sur certains régimes de locomotion, ce que le secteur débattait encore il y a dix-huit mois. Ce travail s'inscrit dans un mouvement vers les contrôleurs dits "fondation" pour la robotique incarnée. En manipulation, des systèmes comme pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) ont déjà exploré la généralisation cross-embodiment sur bras et effecteurs; l'extension à la locomotion whole-body humanoïde est plus contrainte par la stabilité dynamique. Les acteurs du secteur, Figure Robotics (Figure 03), Unitree (G1, H1), Agility Robotics (Digit), Fourier Intelligence et 1X Technologies, maintiennent tous des pipelines de contrôle propriétaires et spécialisés. Si XHugWBC tient ses promesses à l'échelle, il réduirait significativement la barrière à l'entrée pour les nouveaux constructeurs, notamment les acteurs européens comme Enchanted Tools (Mirokaï) ou Wandercraft, qui ne disposent pas des ressources d'entraînement des géants américains. Le preprint n'a pas encore fait l'objet d'une évaluation par les pairs.

UELes constructeurs humanoïdes français Wandercraft et Enchanted Tools (Mirokaï) sont explicitement identifiés comme bénéficiaires potentiels, ce framework pouvant réduire significativement leurs coûts d'entraînement de locomotion sans nécessiter les ressources des géants américains.

💬 C'est le genre de papier qui résout un vrai problème industriel : chaque robot humanoïde qui sort oblige aujourd'hui à tout réentraîner depuis zéro. Sept robots physiques en zero-shot, c'est pas du tout la même chose que des résultats simulés, ça valide quelque chose de sérieux. Pour Wandercraft ou Enchanted Tools, bien plus contraints en ressources que Figure ou Unitree, ce type de contrôleur généraliste c'est du concret.

IA physiqueOpinion

1 source

78arXiv cs.RO

YUBI : interface bidigitale universelle pour la manipulation dextérique bimanuelle à grande échelle

Des chercheurs ont publié le 10 juin 2026 YUBI (Yielding Universal Bidigital Interface), un préhenseur bi-digital conçu pour la collecte de données bimanuelle dextère à grande échelle. Contrairement aux systèmes pistol-grip comme l'UMI (Universal Manipulation Interface), YUBI adopte un principe d'actionnement dit "yielding" : les mouvements des doigts de l'opérateur sont transcrits directement en mouvement des mâchoires du préhenseur, sans intermédiaire mécanique rigide. Le système intègre un tracking 6 DOF basé sur la réalité virtuelle pour une acquisition de trajectoires haute fidélité. L'équipe a constitué un dataset d'une ampleur inédite dans la littérature : 8 434 heures de démonstrations, 1,20 million d'épisodes répartis sur 119 tâches. Un politique unique entraîné sur ce corpus a été validée sur trois plateformes robotiques bimanuelle distinctes : UR, Franka et ELEY, via simple montage du préhenseur. Ce résultat a une portée directe pour quiconque travaille sur les fondation models robotiques : le bottleneck historique n'est plus le modèle mais la donnée, et YUBI apporte une réponse concrète sur la scalabilité de la collecte. Le fait qu'une seule politique transfère sur trois robots hétérogènes confirme que l'interface impose une représentation suffisamment générique pour servir de supervision directe, sans fine-tuning plateforme-spécifique. C'est un argument fort en faveur de l'approche "data-centric" face aux pipelines sim-to-real, souvent coûteux à valider en conditions industrielles. L'ergonomie améliorée réduit aussi la fatigue opérateur sur les tâches fines, un point non-trivial pour des sessions de collecte longues et répétitives que les démonstrateurs UMI rendaient problématiques. L'UMI, développé à l'Université de Columbia et largement adopté pour sa simplicité et son coût, reste la référence low-cost pour la collecte de données manipulation, mais son grip pistolet montrait ses limites sur les tâches bimanuelle complexes. YUBI s'inscrit dans un mouvement plus large visant à démocratiser la collecte de données pour les robot foundation models, en parallèle d'initiatives comme ACT, Diffusion Policy ou les efforts open-data de Physical Intelligence (Pi-0). L'ensemble du stack est publié en open source : hardware du préhenseur, logiciel de collecte, et dataset complet, ce qui représente une contribution substantielle pour les laboratoires ne disposant pas des moyens de Unitree, Figure AI ou Boston Dynamics pour constituer leurs propres corpus propriétaires. Les prochaines étapes probables incluent l'extension du dataset et l'intégration avec des architectures VLA plus récentes.

UELes laboratoires européens (INRIA, CEA-List, universités) et PME robotiques peuvent directement exploiter le dataset open-source YUBI (8 434 h, 1,2M épisodes) et l'interface hardware pour entraîner des politiques de manipulation sans constituer de corpus propriétaire, avec validation native sur Franka (allemand) et UR (danois).

RechercheOpinion

1 source

79arXiv cs.RO

PHUMA : un jeu de données pour la locomotion fiable des robots humanoïdes

Une équipe de chercheurs du laboratoire DAVIAN a publié en juin 2026 PHUMA (Physically Reliable HUMAnoid locomotion dataset), un corpus de 73 heures de données de locomotion humanoide produit via un pipeline en deux étapes : une curation physiquement consciente suivie d'un retargeting contraint par des lois physiques. La base de données agrège à la fois des données de motion capture traditionnelles et des vidéos issues d'internet, les deux étant traitées pour éliminer les artefacts physiques récurrents dans les datasets existants, notamment le flottement, la pénétration géométrique et le foot skating. Entraînées sur PHUMA, les politiques de contrôle obtiennent des taux de succès supérieurs à ceux obtenus avec AMASS et Humanoid-X sur les benchmarks de motion tracking standards, et transfèrent en zero-shot vers un Unitree G1 réel. Le code et les données sont disponibles publiquement via davian-robotics.github.io/PHUMA. Le principal verrou que PHUMA prétend lever est la qualité physique des données d'entraînement pour l'imitation de mouvement humanoide. Les approches par imitation sont attractives parce qu'elles permettent d'acquérir des comportements naturels sans reward engineering fastidieux, mais leur efficacité dépend directement de la cohérence physique des données sources. Les artefacts présents dans les datasets basés sur des vidéos internet (comme Humanoid-X) se propagent dans les politiques entraînées, produisant des robots qui glissent ou oscillent de façon instable. La démonstration de transfert zero-shot sur un Unitree G1 physique est le point le plus concret : elle suggère que le filtrage physique en amont réduit effectivement le sim-to-real gap, sans fine-tuning additionnel sur hardware. Reste à qualifier l'ampleur du gain : les métriques de benchmarks internes ne se substituent pas à des comparaisons en conditions réelles standardisées. AMASS, publié en 2019, est resté longtemps la référence en motion capture humanoide, mais sa taille limitée et son coût d'acquisition ont freiné la scalabilité des approches data-driven. Humanoid-X a tenté de combler ce vide en exploitant des vidéos YouTube à grande échelle, au prix d'une dégradation qualitative. PHUMA s'inscrit dans une dynamique plus large où plusieurs équipes cherchent à constituer des datasets de locomotion humanoide à la fois volumineux et physiquement valides, en parallèle des travaux de Figure AI (Figure 03), Boston Dynamics, et des équipes derrière GR00T N2 chez NVIDIA. La prochaine étape logique serait de tester PHUMA sur d'autres plateformes humanoïdes commerciales (H1, Digit) et d'élargir les tâches au-delà de la locomotion simple vers la manipulation en déplacement.

UELe dataset PHUMA étant en accès libre, les équipes de recherche européennes en locomotion humanoïde (INRIA, CEA-List, LAAS-CNRS) peuvent l'intégrer directement dans leurs pipelines d'entraînement sans coût d'acquisition.

RecherchePaper

1 source

80arXiv cs.RO

Apprentissage de la représentation du contact pour l'odométrie des jambes

Une équipe de chercheurs a publié sur arXiv (référence 2606.05501) une approche d'apprentissage de représentation auto-supervisée pour la détection de contact dans les robots à pattes, visant à améliorer l'odométrie locomotrice sans recourir à des capteurs de force aux extrémités. Le système repose exclusivement sur les encodeurs articulaires standard, présents sur la quasi-totalité des plateformes commerciales existantes. En modélisant les phases d'appui et de vol (stance et swing) de façon probabiliste, le framework permet d'estimer la vitesse du corps principal à partir de la chaîne cinématique des membres, en s'appuyant sur l'hypothèse classique que la vitesse du pied par rapport au monde est nulle en phase d'appui. Les résultats expérimentaux indiquent des performances supérieures aux méthodes supervisées nécessitant des capteurs additionnels et aux approches probabilistes de référence. Le code est publié en open source. L'enjeu est concret : l'odométrie par jambes est une brique fondamentale pour la navigation autonome des robots quadrupèdes et bipèdes, notamment lorsque le GNSS ou la vision sont dégradés. Or, les capteurs de réaction au sol (GRF sensors) alourdissent les pieds, augmentent la complexité mécanique et sont souvent aveugles aux glissements en contact, ce qui produit des dérives d'estimation même lorsque le pied est techniquement "posé". En éliminant cette dépendance sensorielle, cette approche ouvre la voie à un déploiement sur des plateformes à budget contraint, et surtout améliore la robustesse sur surfaces glissantes ou irrégulières, scénario typique des environnements industriels ou d'inspection. La nature auto-supervisée supprime également le coût d'annotation de données, un frein classique dans les pipelines de locomotion. Le problème de la détection fiable de la phase d'appui est étudié depuis l'essor des robots quadrupèdes comme ANYmal (ANYbotics) et Go1/Go2 (Unitree), ainsi que des bipèdes comme Spot (Boston Dynamics) ou Atlas. La majorité des stacks d'odométrie actuels, y compris ceux utilisés dans des frameworks open source comme Legged Gym ou OCS2, conservent une dépendance aux GRF sensors ou à des heuristiques de seuillage. Cette contribution s'inscrit dans une tendance plus large visant à rendre la locomotion avancée accessible sur des plateformes sans instrumentation de pointe, une direction également explorée par des labos européens comme le DLR ou l'INRIA. La prochaine étape naturelle sera la validation sur plusieurs morphologies de robots et dans des conditions de terrain dégradé, un benchmark que les auteurs n'ont pas encore publié.

UEL'approche intéresse directement des équipes comme l'INRIA qui travaillent sur la locomotion avancée, et pourrait être intégrée sans modification matérielle sur des plateformes européennes à budget contraint.

RecherchePaper

1 source

8136Kr

Stardust Intelligence lève plus d'un milliard de yuans en série B, sa valorisation dépasse 10 milliards

Astribot (星尘智能), startup shenzhenoise spécialisée dans les humanoïdes à transmission par câble, a bouclé une série B représentant plus d'un milliard de yuans (environ 125 millions d'euros) en trois tours sur trois mois. Sa valorisation dépasse désormais 10 milliards de yuans, la hissant au rang de licorne shenzhenoise de l'embodied intelligence. Le tour réunit des fonds régionaux (Liangxi Tech Innovation Fund géré par Bohua Capital, Yangzhou Longtou Xinli), l'industriel ThinkTech (中科创达), GUOKE Investment, et confirme le réinvestissement d'actionnaires historiques liés à Tencent, Alibaba et ByteDance. Sur le plan commercial, Astribot signe une commande de l'ordre du millier d'unités avec ThinkTech pour des applications industrielles et de services, avec expansion à l'export, ainsi que la co-construction d'un centre d'application de 100 millions de yuans avec la zone de développement économique de Jiangdu pour l'hôtellerie et le tourisme culturel. La gamme T1, lancée à 89 900 yuans (environ 11 500 euros), exécute des tâches en séquence continue : cuisson, service en bar, tri de pièces automobiles, manipulation chimique. Des livraisons à l'échelle du millier d'unités ont démarré fin 2025. Ce qui distingue Astribot sur le plan technique, c'est son choix de la transmission tendineuse par câble (rope-driven), imitant la biomécanique musculaire humaine : moteurs déportés, câbles tractant les articulations, avec un couplage rigide-souple qui préserve la rigidité opérationnelle tout en absorbant les chocs. L'entreprise revendique être la première au monde à avoir industrialisé cette approche en production de masse pour des humanoïdes IA. Pour les intégrateurs, cela signifie un meilleur rapport charge utile/masse, moins de backlash mécanique, et des données de force proprioceptives de haute qualité transmises fidèlement au modèle, un avantage critique pour l'apprentissage de la physique réelle. L'intelligence embarquée repose sur DuoCore, une architecture bicéphale rapide/lente inspirée du double système cognitif humain, structurellement convergente avec l'architecture Helix de Figure dévoilée quasi simultanément, ce qui constitue une validation indépendante de cette direction. Le système rapide gère la compliance articulaire et l'évitement d'obstacles en temps réel ; le système lent planifie les tâches longues et coordonne les deux bras. Le modèle de fondation VLA maison, Lumo, entraîné par pré-entraînement puis alignement sur robot physique, affiche une généralisation à des objets inconnus et des environnements non vus. DuoCore est déjà déployé en conditions réelles dans la distribution au détail dans six villes chinoises, ce qui constitue un déploiement opérationnel, pas une démonstration en laboratoire. Astribot a été fondée en 2022 par Lai Jie, qui cumule 17 ans d'expérience en IA et robotique : il a été le premier employé et architecte du laboratoire de robotique de Tencent, puis directeur de l'équipe robot Xiaodu chez Baidu. Sa philosophie "Design for AI" consiste à concevoir d'abord un corps adapté à l'apprentissage par un grand modèle, puis à y adjoindre l'algorithme, structurant ainsi toute l'architecture produit. L'entreprise s'inscrit dans un secteur très concurrentiel face à Unitree (G1, H1), Figure (02, Helix), Boston Dynamics (Atlas électrique), Agility Robotics (Digit), et côté chinois, Fourier Intelligence et Galbot. Sa différenciation repose sur la transmission câblée et une stratégie de données axée sur l'efficacité plutôt que le volume brut. Les prochaines étapes annoncées incluent l'internationalisation des commandes ThinkTech et l'intégration de capacités de modèle du monde (world model) dans les futures versions de Lumo.

UELa montée en puissance d'Astribot renforce la pression concurrentielle sur les acteurs européens de l'humanoïde (Wandercraft, Enchanted Tools) ; l'internationalisation annoncée des commandes ThinkTech pourrait atteindre l'Europe, mais aucun déploiement ou partenariat européen n'est confirmé à ce stade.

Chine/AsieOpinion

1 source

82Interesting Engineering

7 robots inspirés du vivant qui relèvent de vrais défis d'ingénierie

Six familles de robots à morphologie animale concentrent une part croissante des efforts en robotique appliquée, couvrant des secteurs aussi divers que l'inspection industrielle, le sauvetage en catastrophe, la maintenance offshore et l'aquaculture. Le quadrupède Spot, commercialisé par Boston Dynamics, est déjà opérationnel dans des centrales électriques, des installations pétrolières et des chantiers pour des missions de surveillance en environnement dangereux. Les robots serpents, dotés de corps segmentés articulés, ont été testés par des équipes de recherche et des équipes de secours pour localiser des survivants dans des décombres post-séisme, là où les plateformes conventionnelles ne peuvent pas pénétrer. Des robots grimpeurs reproduisent les micro-structures adhésives des pattes de gecko pour inspecter verticalement ponts et infrastructures. En milieu offshore, le robot Eelume, développé par la spin-off NTNU éponyme soutenue par Equinor et Kongsberg, adopte la locomotion ondulatoire de l'anguille pour inspecter pipelines et plateformes en restant déployé durablement sous l'eau. Des chercheurs du CIRTESU (Centre de recherche en robotique et technologies sous-marines) de l'Universitat Jaume I ont récemment testé à PortCastelló un poisson-robot biomimétique à propulsion par nageoires, sans hélices, équipé de sonar et de systèmes de vision, pour surveiller les filets de fermes aquacoles. Le laboratoire CREATE de l'EPFL a par ailleurs présenté un bras souple reposant sur une structure d'hélicoïde tronqué (trimmed helicoid), inspirée de la trompe d'éléphant et des tentacules de pieuvre, qui module rigidité et flexibilité localement pour permettre une manipulation délicate en contexte co-robotique. Ces plateformes répondent à des problèmes industriels documentés, pas à des curiosités de laboratoire. Eelume modifie structurellement l'économie de la maintenance offshore : là où un ROV traditionnel nécessite un navire de surface et dépend de la météo, un système résident opère en continu, réduisant les coûts d'intervention. La propulsion par nageoires du robot valencien surpasse les hélices en discrétion et efficacité énergétique dans les milieux aquacoles. Spot constitue le cas commercial le plus avancé de la tendance, Boston Dynamics ayant livré plusieurs centaines d'unités à des industriels. Pour les autres familles, notamment les robots serpents, les tests restent majoritairement conduits en environnements contrôlés : le fossé sim-to-real pour des décombres réels n'est pas résolu. L'approche soft robotics de l'EPFL illustre une stratégie alternative : intégrer la compliance mécanique dans la conception plutôt que de la gérer par contrôle actif, ce qui simplifie considérablement l'implémentation en environnement co-robotique. Boston Dynamics développe Spot depuis les travaux fondateurs de Marc Raibert au MIT ; l'entreprise a été rachetée par Hyundai en 2021 pour 1,1 milliard de dollars. Sur le segment quadrupède, la concurrence est vive : ANYbotics (ANYmal), Unitree (Go2, H1) et Ghost Robotics (Vision 60) ciblent les mêmes marchés industriels avec des positionnements prix différenciés. Eelume opère sur le marché oil & gas depuis plusieurs années avec le soutien de majors du secteur. En Europe, Pollen Robotics et Enchanted Tools développent des architectures à inspiration biologique, mais restent peu positionnés sur ces créneaux applicatifs précis. L'aquaculture robotisée bénéficie de financements croissants dans le cadre du Blue Deal européen, ce qui devrait accélérer les déploiements à l'image du projet de l'Universitat Jaume I. L'intégration de modèles VLA (vision-language-action) pour la compréhension contextuelle des tâches et la certification ATEX pour les robots industriels constituent les prochains jalons pour plusieurs de ces familles.

UEPlusieurs acteurs européens figurent parmi les leaders des niches couvertes, Eelume/NTNU (soutenu par Equinor et Kongsberg) sur la maintenance offshore résidente, l'EPFL sur la soft robotics co-robotique, l'Universitat Jaume I sur l'aquaculture, et le financement croissant via le Blue Deal européen devrait accélérer les déploiements dans ce secteur, créant des opportunités pour les startups françaises Pollen Robotics et Enchanted Tools si elles se positionnent sur ces créneaux applicatifs.

IndustrielActu

1 source

83Pandaily

ORBBEC s'étend au-delà de la vision robotique vers l'IA physique et l'impression 3D

ORBBEC (688322.SH), fabricant chinois de capteurs de vision 3D, annonce un élargissement stratégique vers quatre segments: Physical AI, vision IA généraliste, impression 3D et acquisition de données volumétriques. La société revendique plus de 70% de part de marché en Chine et en Corée du Sud sur le créneau vision robotique de service, s'appuyant sur une décennie de R&D qui lui a permis de taper une douzaine de puces propriétaires couvrant lumière structurée, iToF (temps de vol indirect), dToF et LiDAR. Ces capteurs sont d'ores et déjà intégrés dans les chaînes d'approvisionnement des fabricants d'humanoïdes AgiBot, UBTech et Unitree. Le 29 mai 2026, ORBBEC a élargi son partenariat avec Creality 3D, récemment introduite en bourse à Hong Kong, pour co-créer un centre d'innovation en scanners 3D et lancer une plateforme commune baptisée "3D Printing AI Vision Intelligent Platform". Financièrement, le premier trimestre 2026 affiche 203 millions de RMB de chiffre d'affaires, avec un bénéfice net retraité en hausse de 531% sur un an -- chiffre spectaculaire qui s'explique probablement par un faible niveau de base et qui reste à confirmer dans la durée. La portée industrielle de ce repositionnement tient à trois leviers combinés. En Physical AI, les capteurs ORBBEC alimentent les world models de simulation via une intégration confirmée dans NVIDIA Isaac Sim, ce qui positionne la société comme fournisseur de données réelles pour le cycle sim-to-real -- un noeud critique que peu d'acteurs hardware maîtrisent de bout en bout. Sur l'impression 3D, le contexte est porteur: les exports chinois du secteur ont progressé de 119% en glissement annuel sur les quatre premiers mois de 2026, rendant le partenariat Creality stratégiquement opportuniste. Enfin, la transition de "fournisseur de composants" vers "perception-as-a-service" signifie une montée vers les couches logicielles (reconnaissance, décision), ce qui modifie structurellement le profil de marges -- les analystes anticipent une amélioration du mix produit et une expansion des marges brutes tout au long de 2026. ORBBEC prend pied dans un marché longtemps dominé par des acteurs occidentaux aujourd'hui en retrait: Intel a arrêté sa gamme RealSense en 2023, Microsoft a mis fin à l'Azure Kinect la même année, laissant un vide que Stereolabs (ZED Camera), Photoneo ou Zivid cherchent à combler sur le segment industriel haut de gamme. ORBBEC se présente comme une alternative chinoise à coût compétitif, avec un ancrage fort sur le marché asiatique des robots de service et une ambition d'intégration verticale puce-algorithme-optique. Les prochaines étapes déclarées incluent le déploiement effectif du centre d'innovation commun avec Creality et le lancement commercial de la plateforme impression 3D. Les projections sectorielles évoquent un marché combiné scan-impression-modélisation 3D approchant les mille milliards de dollars sur la décennie -- une estimation à prendre avec précaution, mais qui illustre l'amplitude de la thèse de croissance que la société cherche à incarner.

UELe repositionnement d'ORBBEC intensifie la pression concurrentielle sur Stereolabs (France/ZED Camera) et Photoneo dans le segment capteurs 3D pour robotique industrielle, alors qu'Intel et Microsoft ont abandonné ce marché en 2023.

Chine/AsieOpinion

1 source

84The Robot Report

NIST propose un benchmark de référence pour évaluer les performances des robots humanoïdes

Le National Institute of Standards and Technology (NIST) a publié en avril 2026 une proposition de référentiel de performance standardisé pour les robots humanoïdes, décrit comme un ensemble de tâches de locomotion et de manipulation à faible empreinte logistique. C'est le premier cadre d'évaluation de ce type depuis le DARPA Robotics Challenge de 2015, selon Aaron Prather, directeur du programme Robotics & Autonomous Systems chez ASTM International. Le benchmark couvre quatre dimensions : la mobilité de base (agnostic au domaine d'application), la manipulation et la dextérité, les capacités combinées loco-manipulation, le contrôle en espace contraint, et un niveau minimal de raisonnement et de compréhension de scène. Le NIST prévoit de fabriquer un nombre limité d'appareils de test physiques pour les distribuer gratuitement aux fabricants américains d'humanoïdes et aux centres de test régionaux, et de publier les plans et modèles 3D pour usage en environnement physique ou virtuel (simulateurs de training et de développement de contrôle). Les données collectées seront agrégées sous des accords de partage préapprouvés protégeant la propriété intellectuelle. L'absence de standard commun est un problème structurel pour le secteur : Tesla Optimus, Figure, Agility Robotics, Apptronik, Unitree et une douzaine d'autres plateformes humanoïdes ont attiré des milliards de dollars d'investissement ces dix dernières années sans qu'il existe de méthode consensuelle pour mesurer ce qu'elles font réellement. Comme le note Prather, "les vidéos marketing ont comblé le vide". Pour un intégrateur industriel ou un décideur B2B, l'absence de benchmarks opposables rend toute comparaison entre plateformes impossible et ralentit les décisions d'achat. Ce référentiel, s'il est adopté, permettrait d'objectiver le fossé entre démo et déploiement réel, de quantifier les progrès en loco-manipulation et en whole-body control, et d'offrir aux chercheurs une baseline reproductible. Il représente aussi un signal réglementaire potentiel : un benchmark NIST peut devenir une norme de fait pour les appels d'offres gouvernementaux américains. Ce projet s'appuie sur la collaboration antérieure du NIST avec le DARPA pour évaluer les capacités humanoïdes dans l'industrie et la recherche académique. En Europe, le Fraunhofer IPA (Stuttgart) a publié ce mois-ci son propre référentiel de sécurité et de développement pour humanoïdes, structuré autour de six critères, signalant que la course aux standards est désormais transatlantique. Aucun acteur français ou européen n'est directement impliqué dans la proposition NIST à ce stade, bien que des entreprises comme Enchanted Tools ou Wandercraft pourraient être concernées si ce cadre influence les standards ISO ou CEN. Le NIST est en phase de consultation et recherche des participants, fabricants comme labos, pour affiner la liste des tâches et tester leurs robots dans les installations NIST ou partenaires. Aucune date de finalisation n'est annoncée.

UELe Fraunhofer IPA a publié ce même mois son propre référentiel de sécurité pour humanoïdes, signalant une course transatlantique aux standards ; si le benchmark NIST influence les normes ISO/CEN, des acteurs européens comme Enchanted Tools ou Wandercraft devront adapter leur processus de qualification.

InfrastructureOpinion

1 source

85Interesting Engineering

La nouvelle usine d'ENGINEAI (12 000 m²) produit un robot humanoïde toutes les 15 minutes

ENGINEAI, startup robotique fondée en octobre 2023 et basée à Shenzhen, a inauguré une usine de fabrication en série de robots humanoïdes dans le district de Honghualing. L'installation couvre environ 12 000 m² et intègre l'ensemble de la chaîne de valeur : contrôle qualité entrant, tests de composants, assemblage, tests pré-expédition, logistique et service après-vente. Selon l'entreprise, la cadence de production atteint un robot toutes les 15 minutes, soit potentiellement jusqu'à 35 000 unités par an en rythme continu. Chaque machine doit passer 79 contrôles qualité et 46 tests de simulation avant expédition. Les premiers exemplaires du T800, robot humanoïde polyvalent à vocation industrielle lourde, ont déjà quitté la chaîne. En parallèle, ENGINEAI prépare un second site à Zhengzhou, dans la province du Henan, dédié à une ligne de production de 10 000 unités supplémentaires, intégrée dans le Yunzhi Science Park. Cette expansion s'appuie sur une levée de fonds de série B de 200 millions de dollars clôturée en avril 2026, valorisant la société à plus de 10 milliards de yuans (environ 1,4 milliard de dollars). Le passage à une production industrielle cadencée représente un signal structurant pour le secteur. Jusqu'ici, la quasi-totalité des constructeurs d'humanoïdes, y compris des acteurs bien financés comme Figure ou 1X, opéraient en mode artisanal ou semi-série, avec des volumes annuels comptés en dizaines ou centaines d'unités. Une cadence de 1 robot toutes les 15 minutes, si elle est confirmée en régime nominal et non seulement revendiquée en pic de démo, constituerait une rupture dans le ratio coût/volume. Elle valide aussi l'hypothèse que le goulot d'étranglement de la filière n'est plus uniquement logiciel (contrôleurs, VLA, sim-to-real), mais bien industriel. Pour les intégrateurs et décideurs B2B, cela change le calcul : la question n'est plus "aura-t-on accès à des robots ?" mais "à quel prix et avec quel support ?" La précision des 79 points de contrôle et 46 tests de simulation suggère une démarche sérieuse de standardisation, même si ENGINEAI n'a pas publié de données indépendantes sur les taux de défauts ou la fiabilité terrain. ENGINEAI s'inscrit dans une vague d'industriels chinois qui accélèrent sur l'humanoïde depuis 2024, portés par des politiques publiques favorables et une base de fournisseurs actuateurs/capteurs mature dans la région de Shenzhen. La société commercialise quatre plateformes : le T800 (humanoïde lourd), le PM01 (humanoïde généraliste), le SA02 (robot compagnon léger) et le JS01 (quadrupède). Ses cibles déclarées sont l'industrie et l'inspection, soit les mêmes segments qu'Agility Robotics (Digit, déployé chez Amazon), Figure (accord BMW), Unitree ou Fourier Intelligence. Sur le plan concurrentiel, la proximité géographique avec les fournisseurs de la chaîne d'approvisionnement shenzhenoise constitue un avantage structurel face aux acteurs américains. Les prochaines étapes annoncées incluent la montée en puissance du site de Zhengzhou et l'atteinte du seuil des 10 000 unités cumulées, sans calendrier précis communiqué à ce stade.

UELa montée en capacité industrielle cadencée de la filière humanoïde chinoise accentue la pression sur les intégrateurs et constructeurs européens (ABB, KUKA, Stäubli) : si les chiffres se confirment en régime nominal, le ratio coût/volume change structurellement et les décideurs B2B européens devront revoir leurs calculs de TCO pour leurs lignes de production d'ici 2027.

Chine/AsieOpinion

1 source

86The Robot Report

Guide complet des événements du Robotics Summit & Expo 2026

Le Robotics Summit & Expo 2026 ouvre ses portes le 27 mai à Boston, au Thomas M. Menino Convention & Exhibition Center. L'événement réunit plus de 5 000 experts de la robotique et 200 exposants sur deux jours, avec plus de 50 sessions réparties en cinq tracks : intelligence artificielle, design et développement, technologies habilitantes, santé et logistique. Plus de 70 intervenants représentent des acteurs comme Amazon Robotics, Universal Robots, Locus Robotics, Boston Dynamics, Agility, Tesla, le Toyota Research Institute, Harmonic Drive, maxon, PickNik Robotics et Intrinsic. La première journée s'ouvre à 9h par le panel "Building the Next Era of Robot Autonomy", avec Aaron Parness (directeur de la science appliquée chez Amazon Robotics), Anders Beck (VP produits AI robotics chez Universal Robots), Hamid Montazeri (SVP software et IA chez Locus Robotics) et John Wall (président de QNX). À 10h suivra le panel "The State of Humanoids", incluant Alberto Rodriguez (directeur du comportement robot pour Atlas chez Boston Dynamics) et Pras Velagapudi (CTO d'Agility Robotics). Le 28 mai, Brian Gerkey (board chair d'Open Robotics et CTO d'Intrinsic) livrera la keynote "An Open Foundation for the Age of AI-Powered Robots", et la conférence se clôturera par le témoignage de Noland Arbaugh, premier utilisateur d'un implant cérébral Neuralink. La concentration de sessions de haut niveau sur l'autonomie et les humanoïdes reflète le basculement du secteur d'une phase de démonstration vers une phase de commercialisation active. La présence d'Alberto Rodriguez (Boston Dynamics) et de Pras Velagapudi (Agility) sur le même panel humanoïde est révélatrice : ces deux entreprises sont actuellement les seules à pouvoir revendiquer des déploiements clients documentés à échelle industrielle, et leur coprésence sur scène illustre une compétition directe pour les contrats pilotes. Le thème porté par Gerkey (Intrinsic, filiale Alphabet) sur les fondations logicielles ouvertes pour robots IA pointe une tension structurelle du secteur : la fragmentation des stacks ROS freine l'interopérabilité, et plusieurs acteurs cherchent à imposer un middleware de référence avant que le marché ne se verrouille autour d'un standard propriétaire. Le Robotics Summit est organisé par The Robot Report et Peerless Media, et constitue l'un des deux grands rendez-vous professionnels de la robotique aux États-Unis avec RoboBusiness. L'édition 2026 se tient dans un contexte de forte pression concurrentielle sur le segment humanoïde : Figure AI, 1X, Apptronik, Unitree et Fourier Intelligence ont multiplié les annonces depuis dix-huit mois, tandis que les déploiements réels documentés restent rares. L'absence dans le programme de représentants de Figure AI ou de 1X peut indiquer un positionnement délibéré de ces acteurs en dehors des canaux de conférence traditionnels, ou simplement un agenda non finalisé. Les RBR50 Innovation Awards, remis lors du dîner du soir du 27 mai, constitueront un baromètre utile des projets jugés les plus significatifs par la communauté professionnelle cette année.

IndustrielActu

Aussi sur Robotics Business Review,Robotics Business Review

87arXiv cs.RO

OCELOT : odométrie et estimation du contact pour robots à pattes

Une équipe de chercheurs a publié OCELOT (Odometry and Contact Estimation for Legged rObots), un pipeline complet d'odométrie pour robots à pattes reposant exclusivement sur des capteurs proprioceptifs embarqués : une centrale inertielle (IMU) solidaire du corps, des encodeurs articulaires et des capteurs de force. Le système s'appuie sur un filtre de Kalman à état d'erreur (ESEKF) dont l'état est corrigé par les pieds détectés en appui stationnaire. Sa contribution centrale est un module de détection de contact fusionnée et de quantification d'incertitude : deux détecteurs tournent en parallèle pour chaque pied, le premier combinant un modèle de mélange gaussien (GMM) avec une machine à états finis (FSM) à déclenchement anti-rebond sur les données de force, le second appliquant un test de rapport de vraisemblance généralisé (GLRT) sur la vélocité cinématique estimée du pied. Les scores continus issus des deux détecteurs sont fusionnés pour identifier les glissements. Pour valider l'approche, les auteurs ont constitué un dataset de 29 séquences couvrant 2,4 km sur des terrains variés (béton, herbe, graviers, rochers) et ont comparé OCELOT à des méthodes proprioceptives et extéroceptives. Le code et un package ROS2 temps réel sont publiés en open source. L'intérêt principal de OCELOT réside dans sa robustesse aux terrains glissants sans recourir à des capteurs extéroceptifs (caméra, lidar), qui restent coûteux, fragiles et sensibles aux conditions d'éclairage ou de poussière. Pour un intégrateur déployant un robot quadrupède en environnement industriel ou outdoor, disposer d'une odométrie fiable avec uniquement l'équipement embarqué de série réduit significativement la complexité système. La disponibilité d'un package ROS2 prêt à l'emploi abaisse la barrière d'adoption. Le benchmark face à des méthodes extéroceptives constitue un signal fort : il suggère que l'estimation de contact bien conçue peut rivaliser avec des approches visuelles sur des trajectoires courtes à moyennes. Les robots à pattes de type Spot (Boston Dynamics), ANYmal (ANYbotics) ou Unitree B2 sont les cibles naturelles de tels pipelines. L'odométrie proprioceptive pour quadrupèdes est un problème ouvert depuis des années, avec des travaux antérieurs comme Pronto (IIT) ou les pipelines d'ETH Zurich sur ANYmal. OCELOT se distingue par la combinaison explicite GMM+GLRT pour la détection de glissement, un point sensible dans les déploiements extérieurs. Les prochaines étapes probables incluent la validation sur des trajectoires longue distance et l'intégration dans des architectures SLAM proprioceptif complet.

UELa publication en open source d'un package ROS2 directement intégrable peut bénéficier aux intégrateurs et labos européens (ANYbotics/Suisse, IIT/Italie) déployant des quadrupèdes en environnements industriels ou extérieurs difficiles.

RecherchePaper

1 source

88arXiv cs.RO

RoboJailBench : évaluation des attaques et défenses adversariales dans les agents robotiques incarnés

Des chercheurs du PurSec Lab ont publié RoboJailBench, un benchmark standardisé pour évaluer les attaques adversariales de type "jailbreak" et leurs contre-mesures dans les systèmes d'IA embarquée. Présenté sur arXiv (2605.19328), ce framework cible les agents robotiques et véhicules autonomes qui s'appuient sur des Vision-Language Models (VLMs) pour interpréter l'environnement visuel et exécuter des commandes en langage naturel. Il repose sur trois composantes: une taxonomie de sécurité dérivée des normes ISO et d'incidents documentés, couvrant 18 catégories de violations; un pipeline de données "intent contrast" associant à chaque exemple un objectif adversarial et un objectif bénin, afin de mesurer conjointement sécurité et utilité; et un dépôt évolutif de métriques standardisées. Les auteurs ont construit un dataset taxonomique, enrichi cinq datasets existants, intégré quatre types d'attaques et deux défenses, puis évalué l'ensemble sur les principaux VLMs embarqués actuels. Un leaderboard public est maintenu sur purseclab.github.io. L'enjeu dépasse la recherche académique. Un robot compromis par un jailbreak n'affiche pas une réponse textuelle inappropriée: il exécute une action physique potentiellement dangereuse. Les benchmarks existants ciblaient soit les LLMs conversationnels, soit la sécurité non-adversariale des agents incarnés, sans jamais capturer le triptyque risques adversariaux, conséquences physiques et arbitrage sécurité-utilité. Quantifier explicitement ce compromis est une contribution méthodologique significative: un système trop défensif bloque des commandes légitimes et devient inutilisable en production. Pour les intégrateurs industriels, une grille d'évaluation ancrée dans les normes ISO simplifie la qualification réglementaire avant tout déploiement réel. La montée en puissance des VLMs dans la robotique physique, illustrée par pi0 de Physical Intelligence, GR00T N2 de NVIDIA ou les architectures de Figure AI, a considérablement élargi la surface d'attaque des systèmes autonomes. Des travaux antérieurs avaient documenté la vulnérabilité des agents embarqués aux jailbreaks visuels ou textuels, mais sans cadre d'évaluation reproductible. Alors que des fabricants comme Boston Dynamics, Unitree ou, côté européen, Enchanted Tools intègrent des VLMs en production, la robustesse adversariale est appelée à devenir une exigence réglementaire dans les secteurs logistique, manufacturier et médical. RoboJailBench pose une base commune sur laquelle industriels et académiques peuvent s'appuyer pour standardiser ces tests avant mise en service.

UELe benchmark RoboJailBench, ancré dans les normes ISO, fournit aux intégrateurs européens, dont Enchanted Tools (France) qui déploie des VLMs en production, un cadre standardisé pour qualifier la robustesse adversariale avant mise en service sous les exigences de l'AI Act.

Societe/EthiqueOpinion

1 source

89arXiv cs.RO

Marche, course et récupération unifiées pour robots humanoïdes via des priors de mouvement adversariaux adaptatifs

Une équipe de chercheurs a publié fin mai 2026 sur arXiv (arXiv:2605.18611) un framework d'apprentissage par renforcement unifié permettant à un seul contrôleur de faire marcher, courir et se relever après une chute le robot humanoïde Unitree G1, sans commande explicite de changement de mode au déploiement. L'approche étend les Adversarial Motion Priors (AMP) en remplaçant la distribution de référence globale par un mécanisme de routage conditionné à l'état : un seuil fixe sur la gravité projetée (|gz+1| > 0,6, soit environ 37° d'inclinaison du torse par rapport à la verticale) aiguille chaque transition d'entraînement soit vers un discriminateur dédié à la récupération, soit vers un discriminateur de locomotion conditionné par la vitesse commandée, qui couvre à la fois la marche et la course. Seuls trois clips de motion capture extraits du jeu de données LAFAN1 sont nécessaires pour régulariser l'ensemble du comportement. Sur hardware réel, la politique tourne à 50 Hz sous forme d'un fichier ONNX figé, sans aucune logique de mode à l'exécution, et valide des relevés réussis depuis les positions ventrale et dorsale ainsi que des transitions fluides marche-course. Ce résultat s'attaque directement à un problème d'intégration récurrent dans la robotique humanoïde commerciale : la fragmentation en contrôleurs spécialisés par mode, reliés par des automates à états qui génèrent des zones de transition fragiles et coûteuses à maintenir. Démontrer qu'une politique apprise par RL couvre ces régimes de façon continue sur hardware réel, et non uniquement en simulation, affaiblit l'argument du sim-to-real gap rédhibitoire pour les comportements complexes. Le coût d'annotation est lui aussi remarquablement bas : trois clips de reference suffisent là où d'autres travaux en exigent des dizaines, ce qui rend la méthode potentiellement transférable à d'autres plateformes avec un effort de données limité, qu'il s'agisse du PAL Robotics TALOS, du MIROKAÏ d'Enchanted Tools, ou de tout humanoïde léger à faible budget de motion capture. La publication s'inscrit dans une course dense à la locomotion humanoïde robuste, où Boston Dynamics (Atlas), Figure (Figure 03), Agility Robotics (Digit) et Tesla (Optimus Gen 3) investissent massivement, mais publient peu. Sur le plan académique, des approches concurrentes comme les VLA (Vision-Language-Action models) de Physical Intelligence ou les travaux de Berkeley visent des politiques encore plus générales, mais sacrifient souvent la robustesse physique au profit de la flexibilité sémantique. L'utilisation du Unitree G1, disponible à environ 16 000 dollars et largement répandu dans les laboratoires, confère à ces travaux une reproductibilité pratique supérieure aux publications sur plateformes fermées. L'article ne précise pas de timeline de déploiement industriel, mais la compatibilité ONNX et l'absence de logique embarquée à l'exécution réduisent la barrière à l'intégration pour un OEM ou un intégrateur souhaitant évaluer la méthode sur sa propre plateforme.

UELa méthode, compatible ONNX et nécessitant seulement 3 clips de motion capture, est explicitement identifiée comme transférable au MIROKAÏ d'Enchanted Tools (FR) et au TALOS de PAL Robotics (EU), réduisant le coût d'adaptation pour les équipes de recherche et les intégrateurs européens.

RecherchePaper

1 source

90Pandaily

Derrière le marathon robotique d'Honor : 7 fournisseurs chinois au service du robot Lightning

Le 19 avril, sur le parcours semi-marathon de 21,0975 kilomètres du district de Yizhuang à Pékin, le robot humanoïde "Lightning" d'Honor, engagé sous l'étiquette de l'équipe Qitian Daxiansen, a franchi la ligne d'arrivée en 50 minutes et 26 secondes nets. Ce temps réduit de près des deux tiers le record de la compétition établi l'année précédente à 2 heures 40 minutes, et passe sous la barre du record du monde du semi-marathon masculin humain, fixé à 57 minutes et 20 secondes. Ce qui retient davantage l'attention que la performance brute, c'est la chaîne d'approvisionnement entièrement domestique qui sous-tend le robot : GigaDevice (兆易创新) fournit les puces NOR Flash et MCU pour le calcul et le stockage embarqués ; Lingyi iTech (领益智造) livre les composants structuraux de précision et les boîtiers assurant la gestion thermique ; Lens Technology (蓝思科技) produit les optiques de perception visuelle ; AAC Technologies (瑞声科技) contribue aux capteurs haute précision et aux composants acoustiques. Plusieurs autres fournisseurs non nommés couvrent les systèmes de motorisation, de gestion d'énergie et de capteurs de précision. Pour les intégrateurs et décideurs industriels, ce résultat constitue un signal plus structurel que conjoncturel. Il invalide en partie l'hypothèse du "demo gap" : "Lightning" a performé sous les contraintes d'un événement chronométré public, pas en environnement lab. Plus significatif encore, l'ensemble de la chaîne de valeur critique (semi-conducteurs, optique, acoustique, mécanique de précision) provient d'acteurs cotés en Chine, indiquant une autonomie croissante vis-à-vis des fournisseurs occidentaux ou japonais pour les composants humanoides. Ce n'est pas anecdotique dans un contexte de restrictions export sur puces avancées. Honor, connu comme fabricant de smartphones et ex-marque de Huawei, s'est positionné dans la robotique humanoïde depuis 2024, période de montée en puissance massive du secteur en Chine. La compétition de Yizhuang s'inscrit dans une série de benchmarks outdoor visant à différencier les constructeurs capables d'endurance réelle des acteurs encore en phase de démonstration vidéo. Les concurrents directs dans la course humanoïde incluent Unitree, Agibot et Fourier Intelligence côté chinois, ainsi que Figure (Figure 03), Tesla (Optimus Gen 3) et Physical Intelligence (pi0) côté américain. L'article source ne précise ni roadmap de déploiement commercial pour "Lightning" ni pilotes industriels annoncés, ce qui invite à traiter ce résultat comme un jalon technique plutôt qu'un produit shipé.

UELe découplage de la chaîne d'approvisionnement humanoïde chinoise vis-à-vis des fournisseurs occidentaux (semi-conducteurs, optique, mécanique de précision) fragilise à terme la compétitivité des équipementiers européens et renforce le débat autour des contrôles à l'export sur composants avancés.

Chine/AsieOpinion

1 source

91arXiv cs.RO

MVB-Grasp : filtrage par boîte de volume minimal des saisies par diffusion pour la manipulation frontale

Une équipe de chercheurs a publié sur arXiv (référence 2505.09672) MVB-Grasp, un système de saisie robotique conçu pour le bras Unitree Z1, un manipulateur à 6 degrés de liberté (DOF) positionné en configuration frontale, c'est-à-dire face à l'objet plutôt qu'en vue surplombante. Le dispositif expérimental associe une caméra Intel RealSense D405, un détecteur d'objets YOLOv8 et le générateur de prises GraspGen basé sur la diffusion. L'innovation centrale est un filtre géométrique fondé sur la boîte englobante de volume minimal orientée (MVBB) : en analysant les normales des faces de cette boîte en temps O(N), le système élimine les candidats de saisie qui traverseraient la table ou s'aligneraient mal avec les faces accessibles de l'objet. Une fonction de re-scoring combine le score du discriminateur appris et l'alignement géométrique avec un coefficient alpha fixé à 0,85. Sur 81 épisodes de simulation MuJoCo (cylindre, boîte asymétrique, bouteille d'eau), MVB-Grasp atteint 59,3 % de succès contre 24,7 % pour GraspGen seul, soit un gain de 2,4x, confirmé ensuite en conditions réelles sans nécessiter de ré-entraînement du modèle. Ce résultat est notable parce qu'il pointe un angle mort structurel de la recherche en manipulation : les benchmarks standards comme GraspNet-1Billion ou YCB-Video sont quasi-exclusivement conçus pour des caméras en vue de dessus sur des manipulateurs haut de gamme à large espace de travail. Or une part croissante des déploiements industriels et de service implique des bras montés sur des piédestaux fixes ou des AMR, en saisie frontale, avec des contraintes cinématiques sévères. Le fait que le gain soit obtenu sans ré-entraînement, uniquement par un filtre géométrique injecté en post-traitement, démontre que le "sim-to-real gap" dans ces configurations n'est pas seulement un problème de données mais aussi de biais dans la sélection des poses candidates. C'est une piste directement exploitable pour les intégrateurs qui déploient des manipulateurs à bas coût dans des cellules contraintes. Le Unitree Z1 est un bras compact vendu autour de 4 000 à 6 000 dollars, souvent utilisé en recherche académique comme alternative économique aux UR5 ou Franka Panda. La diffusion appliquée à la génération de prises est un axe actif depuis 2022-2023 (GraspGen, SE(3)-DiffusionFields, DexGraspNet 2.0), mais la majorité des travaux optimisent pour des postures overhead. Côté concurrents directs sur les manipulateurs frontaux contraints, les approches d'Enchanted Tools et les travaux issus du LAAS-CNRS en France explorent des contraintes similaires, bien que sur des plateformes différentes. La prochaine étape logique pour cette équipe serait d'étendre le protocole à des objets articulés ou transparents, et d'intégrer le filtre MVBB dans une boucle de planification réactive plutôt qu'en sélection statique de candidats.

UELe filtre MVBB est directement exploitable sans ré-entraînement par des intégrateurs européens déployant des manipulateurs en configuration frontale sur AMR ou piédestaux fixes, et s'inscrit dans la continuité de travaux menés au LAAS-CNRS et chez Enchanted Tools en France sur des contraintes cinématiques similaires.

💬 Un filtre géométrique pur, injecté en post-traitement, qui multiplie le taux de succès par 2,4 sans ré-entraîner le modèle : c'est le genre de résultat qui devrait faire rougir pas mal d'équipes qui empilent des couches de deep learning là où une contrainte bien posée suffit. Ce qui est vraiment utile ici, c'est qu'ils pointent un biais structurel évident en retrospective : tous les benchmarks standards supposent une caméra en vue de dessus, alors que la moitié des bras déployés en prod sont en configuration frontale sur des AMR ou des piédestaux fixes. Le filtre MVBB, tu peux le brancher demain sur ton pipeline existant.

IA physiquePaper

1 source

92arXiv cs.RO

Muninn : un modèle de diffusion de trajectoires, désormais plus rapide

Une équipe de chercheurs a publié Muninn (arXiv:2605.09999), un module d'accélération sans réentraînement pour les planificateurs de trajectoires basés sur la diffusion. Le système atteint jusqu'à 4,6x de gain en vitesse d'exécution sur plusieurs architectures de diffusion en espace d'état, sans dégradation mesurée des performances ni des métriques de sécurité. Muninn fonctionne comme un wrapper de cache : à chaque étape du débruitage itératif, il choisit en temps réel de recalculer la sortie du denoiser ou de réutiliser le résultat mis en cache. Cette décision repose sur deux signaux analytiques calibrés hors-ligne, une sonde légère de l'évolution de la représentation interne de la trajectoire et des coefficients de propagation d'erreur du denoiser, qui produisent ensemble un budget d'incertitude par étape. Ce budget borne formellement l'écart maximal entre la trajectoire mise en cache et celle qui aurait été calculée à pleine puissance de calcul. Les gains ont été validés sur matériel réel, en navigation en boucle fermée et en manipulation. La lenteur des modèles de diffusion en planification de trajectoires est un verrou bien identifié pour la robotique temps-réel. Les accélérations existantes imposaient jusqu'ici un compromis inévitable : modifier le sampler dégradait la qualité de trajectoire, tandis que la compression du réseau nécessitait un réentraînement coûteux. Muninn contourne ce dilemme en opérant strictement sans modifier les poids du modèle, ce qui le rend applicable immédiatement à n'importe quel planificateur diffusion déjà entraîné. Pour un intégrateur ou une équipe robotique industrielle, cela rend concrètement viables des architectures comme Diffusion Policy dans des boucles de contrôle haute fréquence. La certification analytique des bornes de déviation constitue un argument de poids pour les déploiements où la sécurité est une contrainte réglementaire. Les politiques par diffusion appliquées à la robotique ont émergé vers 2022-2023, portées notamment par Diffusion Policy (Chi et al., Columbia University), et se sont depuis déployées dans des architectures VLA et des planificateurs en espace d'état. Les méthodes d'accélération antérieures, DDIM et distillation par connaissance en tête, ne proposaient pas de cache adaptatif avec bornes certifiées, ce qui positionne Muninn comme une surcouche orthogonale et rétrocompatible avec l'existant. En tant que preprint arXiv, les résultats n'ont pas encore été soumis à revue par les pairs. Les prochaines étapes logiques concernent les stacks robotiques humanoïdes et industriels (Figure, Unitree, Boston Dynamics) qui expérimentent des politiques diffusion et cherchent à réduire la latence de planification en production. Le code est publié publiquement sur GitHub (gokulp01/Muninn).

RecherchePaper

1 source

93SCMP Tech

Des robots humanoïdes chinois déployés dans les aéroports japonais face à la pénurie de main-d'œuvre

Japan Airlines (JAL) a annoncé le lancement d'un essai pilote de deux ans utilisant des robots humanoïdes pour les opérations de manutention au sol à l'aéroport de Haneda, à Tokyo. Le programme est mené en partenariat avec GMO AI & Robotics et implique des modèles produits par deux fabricants chinois : Unitree et UBTech. Les tâches visées concernent la gestion des bagages et du fret en piste, des opérations aujourd'hui très dépendantes d'une main-d'oeuvre que le Japon peine structurellement à recruter. Ce déploiement illustre un tournant dans l'adoption de la robotique humanoïde : ce n'est plus un laboratoire ou un salon professionnel, mais un environnement opérationnel contraint, avec des cycles courts, des charges physiques réelles et une pression de fiabilité élevée. Le choix de fournisseurs chinois par une compagnie aérienne japonaise est également notable sur le plan industriel et géopolitique, signalant que la compétitivité prix et la maturité technique des acteurs comme Unitree ou UBTech commencent à peser face aux alternatives japonaises ou occidentales. Pour les intégrateurs, c'est un signal que les humanoïdes entrent dans la chaîne logistique aéroportuaire, un secteur jusqu'ici dominé par les AMR à roues. Le Japon fait face à l'un des taux de vieillissement de la population active les plus sévères au monde, ce qui en fait un terrain d'adoption naturel pour la robotique avancée. Unitree, fondée en 2016 à Hangzhou, est connue pour ses quadrupèdes accessibles (Go1, Go2) et a élargi sa gamme aux humanoïdes (H1, G1). UBTech, basée à Shenzhen, développe des humanoïdes industriels depuis plusieurs années avec son modèle Walker. Ce pilote JAL constitue l'un des premiers déploiements documentés de robots humanoïdes chinois dans une infrastructure aéroportuaire hors de Chine, et ses résultats sur deux ans pourraient accélérer ou freiner des initiatives similaires en Europe et en Asie du Sud-Est.

UELes résultats de ce pilote sur deux ans pourraient accélérer des décisions similaires dans les aéroports européens, en exposant les gestionnaires d'infrastructure à la compétitivité prix et technique des fournisseurs chinois comme Unitree et UBTech.

Chine/AsieActu

1 source

9436Kr

À Silicon Valley, des entreprises d'IA incarnée chinoises et américaines échangent sur 4 problèmes clés

Le 28 avril 2026, MagicLab a tenu à San José sa Global Embodied Intelligence Summit (GEIS), en présence de représentants d'Adobe, TikTok et IBM. La société a présenté trois nouveaux produits : le modèle-monde Magic-Mix, construit sur deux moteurs, Magic-WAM pour la compréhension du monde réel et Magic-Creator pour la génération de données synthétiques en boucle fermée ; la main dextre MagicHand H01, 20 DOF et 44 capteurs tactiles 3D haute résolution ; le robot humanoïde MagicBot X1, 180 cm, 70 kg, 31 DOF actifs, couple articulaire maximal de 450 N·m, fonctionnement continu 24h/7j via double batterie. Ces annonces s'accompagnent d'un objectif commercial de 14 milliards de dollars de revenus d'ici 2036, un chiffre que la société ne détaille pas. La conférence s'inscrit dans une accélération visible du secteur : Zhiyuan Robotics a annoncé sa 10 000e unité en à peine trois mois (de 5 000 à 10 000 robots) ; Unitree affiche dans son prospectus d'IPO 1,707 milliard de RMB de chiffre d'affaires 2025, plus de 5 500 unités expédiées, et plus de 50 % du revenu réalisé à l'international. La GEIS a structuré quatre débats techniques majeurs pour le secteur. Sur la donnée d'entraînement, la stratégie dominante est le mix : MagicLab collecte environ 16 000 trajectoires réelles par jour et les amplifie d'un facteur 10 000 par synthèse, ciblant l'assemblage automobile électrique comme gisement prioritaire (60 à 70 % de processus encore manuels). Zhengyi Luo du NVIDIA GEAR Lab détaille la répartition de son équipe : 50 % données simulées, 15 % motion capture, 25 % vidéos internet, 10 % données réelles haute qualité. Haozhi Qi, chercheur à l'Amazon Frontier AI and Robotics, pose la limite de la synthèse : elle fonctionne pour les compétences élémentaires, pas pour les tâches à horizon long comme préparer un repas. Sur les architectures VLA (vision-langage-action), Qi explique leur dominance actuelle par la maturité des capteurs visuels face aux capteurs tactiles encore embryonnaires, VLA compensant ainsi le déficit sensoriel par la modalité visuelle. Sur les mains dextres, Evan Tao de Chestnut Robotics, ancien membre clé de l'équipe Tesla Optimus, défend une architecture hybride tendons plus IA, recherchant l'équilibre entre manipulation fine et robustesse industrielle. Sur la mise à l'échelle, Jan Liphardt, cofondateur d'OpenMind et professeur associé à Stanford en bioingénierie, recommande un déploiement terrain le plus précoce possible : laboratoires et simulations ne reproduisent pas lumière intense, sols humides ou charnières oxydées, conditions qui révèlent les défaillances systémiques des robots. La tenue de la GEIS en Californie traduit un repositionnement stratégique des acteurs robotiques chinois vers les marchés industriels occidentaux. MagicLab affronte Figure AI, Agility Robotics et Boston Dynamics sur le segment humanoïde industriel, tout en concurrençant Unitree et Zhiyuan sur son marché domestique. La présence de PrismaX, OpenMind et XGSynBot confirme que la commercialisation de la robotique humanoïde est désormais transatlantique. Les déploiements pilotes annoncés visent des usines d'assemblage et des environnements publics, aéroports, écoles, lieux de soins, avec pour objectif explicite d'accumuler des données d'interaction que les simulations les plus sophistiquées ne peuvent pas générer.

UEL'expansion transatlantique des constructeurs chinois (MagicLab, Unitree, Zhiyuan) vers les marchés industriels occidentaux intensifie la pression concurrentielle sur les intégrateurs et fabricants robotiques européens, sans déploiement explicite en Europe annoncé à ce stade.

💬 Zhiyuan passe de 5 000 à 10 000 robots en trois mois, Unitree fait déjà plus de la moitié de son CA à l'export. C'est ça la vraie info, pas les 14 milliards de revenus d'ici 2036 (ça, ça sent la slide investisseur non étayée). Le truc que je retiens de Liphardt : ni labo ni simulation ne reproduisent une charnière oxydée, donc déploie en usine le plus tôt possible.

HumanoïdesOpinion

1 source

95Interesting Engineering

Figure affirme produire un robot humanoïde par heure, soit une multiplication par 24 en quatre mois

Figure, la startup californienne spécialisée en robotique humanoïde, a annoncé avoir atteint un rythme de production d'un robot Figure 03 par heure dans son usine BotQ, située en Californie. Ce chiffre représente une multiplication par 24 du cadence de fabrication en moins de quatre mois, partant d'un robot par jour début 2026. Plus de 350 unités ont été livrées à ce jour, plus de 500 batteries expédiées, et plus de 9 000 actionneurs produits. La ligne de fabrication s'appuie sur un logiciel propriétaire déployé sur plus de 150 postes de travail en réseau, avec plus de 50 points d'inspection intermédiaires. Le taux de réussite en fin de ligne (first-pass yield) dépasse 80 %, et le rendement de production des batteries atteint 99,3 %. Chaque unité subit plus de 80 tests fonctionnels incluant des exercices de stress mécanique (squats, jogging) avant expédition. L'objectif affiché reste de 12 000 robots par an à pleine capacité. Ce passage du stade prototype à la production industrielle est significatif dans la course aux humanoïdes, où la majorité des acteurs restent encore dans des phases de démonstrateur ou de déploiement pilote très limité. Un taux de rendement end-of-line supérieur à 80 % sur un produit mécatronique aussi complexe est un indicateur industriel crédible, bien que Figure ne précise pas la définition exacte de ce seuil ni les conditions de test. En parallèle, Figure a publié une mise à jour majeure de son modèle d'IA Helix, baptisée System 0 (S0). L'ancienne version reposait uniquement sur la proprioception (états articulaires, posture). S0 intègre désormais des caméras stéréo embarquées qui génèrent une représentation 3D de l'environnement, permettant au robot de naviguer des escaliers et des terrains variés avec une stabilité décrite comme comparable à celle d'un humain. Le système est entraîné par renforcement en simulation sur des terrains aléatoires, et les comportements appris se transfèrent directement au monde réel sans recalibration, ce qui constitue une avancée notable sur le classique problème du sim-to-real gap. Figure a été fondée en 2022 par Brett Adcock et a levé plus de 675 millions de dollars, dont une ronde notable en 2024 avec des participations de Microsoft, Nvidia, OpenAI et Samsung. Le Figure 03 est la troisième génération de son robot humanoïde, succédant au Figure 01 et 02. Dans un secteur extrêmement concurrentiel, Figure se positionne face à Tesla (Optimus Gen 2), Boston Dynamics (Atlas électrique), Agility Robotics (Digit, déployé chez Amazon), Physical Intelligence (Pi-0) et Unitree. La montée en volume de BotQ est aussi une course aux données : plus de robots déployés signifie davantage de données réelles pour entraîner Helix. Figure indique viser des déploiements dans les secteurs de la recherche, du commercial et de l'usage domestique, sans préciser de calendrier client ni de prix public pour le Figure 03.

HumanoïdesActu

1 source

96Pandaily

Robotera lève près de 350 M$ en deux mois et revendique le premier PMF en IA incarnée

Robotera, startup chinoise de robotique humanoïde, a finalisé un tour de financement supérieur à 2 milliards de RMB (environ 280 millions de dollars), mené par SF Group avec la participation de Sequoia China, IDG Capital, CICC Capital, Dongfeng Investment, ICBC Capital et des fonds affiliés à China Unicom. Ce nouveau round porte le total levé à près de 2,5 milliards de RMB (environ 350 millions de dollars) en deux mois, la demande ayant selon la société largement dépassé sa cible initiale. Le portefeuille d'investisseurs comprend désormais Alibaba, Geely, BAIC, Dongfeng, Samsung, Lenovo, Haier, Singtel et Woori Financial Group. Sur le plan opérationnel, Robotera annonce avoir commencé au deuxième trimestre 2026 des livraisons à l'échelle de plusieurs milliers d'unités, avec un taux de croissance revendiqué de 300% (sans base de comparaison publiée). La société déploie ses robots dans plus de dix centres logistiques en Chine du Nord, de l'Est et du Sud, en partenariat avec China Post et SF Group, atteignant dans certains contextes jusqu'à 85% de l'efficacité humaine, en cycle continu 24h/24. Ce financement, bouclé en deux mois, traduit un basculement dans la robotique industrielle chinoise : les grands opérateurs ne regardent plus, ils déploient. Pour les intégrateurs et décideurs B2B, le signal fort vient de la logistique, secteur à pénurie de main-d'oeuvre documentée et cycles de rentabilisation courts. Si les métriques annoncées restent difficiles à vérifier hors conditions contrôlées, la présence de SF Group simultanément comme investisseur et client opérationnel suggère un ancrage plus substantiel qu'une démonstration. L'affirmation d'un PMF ("product-market fit") qualifié de "premier de l'industrie" dans l'IA incarnée mérite d'être lue prudemment, mais la combinaison livraisons effectives et partenariats industriels diversifiés, couvrant la logistique, l'automobile avec Geely et Renault, et l'électronique grand public avec Haier, Lenovo et Samsung, distingue ce dossier des annonces purement technologiques. Positionnée sur une architecture full-stack intégrant cerveau IA, contrôle de mouvement, systèmes de données, mains dextres et hardware humanoïde, Robotera entre en compétition directe avec Figure AI (déployé chez BMW), Agility Robotics (Digit chez Amazon) et 1X Technologies côté occidental, ainsi qu'avec Unitree et Fourier Intelligence sur le marché chinois. Sa distinction principale réside dans un ancrage logistique plutôt qu'un focus sur l'assemblage de précision, marché structurellement plus vaste en volume d'unités. La présence de Samsung et Singtel au capital ouvre des scénarios de déploiement au-delà de la Chine, encore non confirmés calendairement. Les indicateurs à surveiller dans les prochains trimestres seront la réduction du coût unitaire à mesure que les volumes augmentent, et la capacité de la société à répliquer ses performances logistiques dans les secteurs automobile et électronique, où les exigences de précision sont sensiblement plus élevées.

UERenault est cité parmi les partenaires automobiles de Robotera, signal indirect pour l'industrie automobile française si ces déploiements s'étendent hors de Chine.

💬 350 millions en deux mois, c'est le chiffre qui accroche. Ce qui compte vraiment, c'est que SF Group est à la fois au capital et client opérationnel : ils déploient ces robots dans leurs propres entrepôts. Difficile d'appeler ça une démo quand c'est le même groupe qui signe le chèque et réceptionne les livraisons.

Chine/AsieOpinion

1 source

97arXiv cs.RO

Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation

Des chercheurs ont publié sur arXiv (arXiv:2604.17258, avril 2026) un pipeline de déploiement rapide permettant de préparer un robot humanoïde à manipuler un nouvel objet en environ 30 minutes, contre un à deux jours dans les approches classiques. Le système s'appuie sur trois composants à base de modèles de fondation : l'annotation automatique via Roboflow pour entraîner un détecteur YOLOv8, la reconstruction 3D par Meta SAM 3D à partir d'images standard (smartphone suffisant, pas de scanner laser), et le suivi de pose 6-DoF en zero-shot par FoundationPose, qui utilise directement le maillage généré par SAM 3D comme gabarit. Les commandes de pose alimentent un planificateur de cinématique inverse sous Unity, transmises en UDP au robot Unitree G1 via le SDK propriétaire. Les métriques annoncées : mAP@0.5 = 0,995 en détection, précision de suivi σ inférieure à 1,05 mm, et saisie réussie sur cinq positions dans l'espace de travail. Le pipeline a également été validé sur une tâche d'application de mastic sur vitre d'automobile, ce qui constitue un environnement industriel concret. L'enjeu principal est la réduction du "time-to-deployment" pour la manipulation humanoïde, un goulot d'étranglement majeur qui freine l'intégration en environnement industriel réel. Passer de deux jours à 30 minutes sans équipement spécialisé change la donne pour les intégrateurs et les PME industrielles qui ne disposent pas d'équipes robotique dédiées. Le recours au zero-shot pour FoundationPose signifie qu'aucun réentraînement n'est nécessaire pour chaque nouvel objet, ce qui valide partiellement l'hypothèse que les modèles de fondation peuvent absorber la variabilité d'objets sans collecte de données lourde. Cela dit, les résultats sont présentés sur cinq positions fixes et deux tâches seulement ; la robustesse en conditions de production non contrôlées reste à démontrer. Le robot support, le Unitree G1, est un humanoïde commercial chinois à 16 degrés de liberté vendu autour de 16 000 dollars, positionné comme plateforme de recherche accessible. Les composants logiciels mobilisés (Roboflow, Meta SAM 3D, FoundationPose de NVidia) sont tous open-source ou accessibles via API, ce qui renforce la reproductibilité. Dans le paysage actuel où Figure (Figure 03), Tesla (Optimus), Physical Intelligence (pi0) et Boston Dynamics investissent massivement dans les pipelines de manipulation apprise, cette approche modulaire et frugale en données offre une alternative pragmatique, notamment pour les déploiements pilotes dans des cellules de production à faible volume ou à variété élevée d'objets.

UELes intégrateurs robotiques et PME industrielles européens peuvent évaluer et reproduire ce pipeline open-source (Roboflow, Meta SAM 3D, FoundationPose) pour réduire drastiquement le time-to-deployment sur des cellules de production à haute variété d'objets, sans équipement spécialisé ni équipe robotique dédiée.

IA physiquePaper

1 source

98Pandaily

Des robots humanoïdes franchissent le cap d'une heure au semi-marathon, réduisant rapidement l'écart avec les humains

Le 19 avril 2026, au semi-marathon de Beijing E-Town, le robot humanoïde "Lightning" développé par Honor a remporté la division robotique avec un temps net de 50 minutes et 26 secondes, soit environ 17 minutes de mieux que le meilleur coureur humain de l'épreuve, crédité d'un temps compris entre 1h07 et 1h08. Les deuxième et troisième places sont revenues aux équipes Leiting Shandian (50:56) et Xinghuo Liaoyuan (53:01), les trois robots ayant complété le parcours en navigation entièrement autonome et sous la barre des 60 minutes. Plus de 100 équipes et environ 300 robots, chinois et étrangers, se sont alignés sur les 21,0975 km d'un tracé intégrant dénivelés, virages à quasi-90 degrés et plus de dix types de terrain différents. Parmi les participants figuraient notamment le "Tien Kung Ultra" du Beijing Innovation Center of Humanoid Robotics et le H1 d'Unitree. L'an passé, le robot vainqueur avait mis 2h40 pour boucler le même type d'épreuve : le bond de performance est donc considérable, même si les conditions exactes de comparaison entre éditions restent à préciser. Ce résultat est significatif au-delà du symbole sportif. Que des robots en navigation autonome, sans téléopération, tiennent un rythme supérieur à celui du meilleur humain du jour sur un semi-marathon en conditions réelles constitue une validation système difficile à ignorer pour les intégrateurs industriels : planification de trajectoire, équilibre dynamique, dissipation thermique et endurance mécanique ont été testés simultanément, sur 21 km, en extérieur. Liu Xingliang, directeur du DCCI Internet Research Institute, identifie trois transitions en cours dans le secteur : passage du contrôle distant à l'autonomie, des laboratoires à la fiabilité d'ingénierie, et des technologies isolées vers des architectures perception-décision-contrôle intégrées. La course illustre concrètement ces trois axes. Elle tend aussi à réduire l'argument du "demo gap" : les robots n'ont pas performé dans un environnement contrôlé mais sur un parcours public, avec terrain variable et forte sollicitation thermique. Honor est entré dans la robotique humanoïde il y a moins de deux ans, via son unité d'incubation industrielle, avec des équipes couvrant les mains dextres, le software système, les algorithmes d'IA embodied et l'ingénierie de test. Lightning embarque un système de refroidissement liquide maison, des capillaires traversant les moteurs, avec une pompe haute pression circulant plus de 4 litres de liquide caloporteur par minute, et des modules d'articulation intégrés atteignant un couple crête de 400 Nm. Lens Technology, fournisseur historique de composants structurels métalliques pour smartphones, a livré plus de 130 pièces de structure pour le robot, signe que la supply chain de l'électronique grand public s'oriente activement vers la robotique. Face à Honor, les acteurs établis comme Unitree et le Beijing Innovation Center of Humanoid Robotics restent en lice, tandis qu'à l'international, Figure, Agility Robotics ou 1X Technologies n'ont pas encore exposé leurs plateformes à des épreuves d'endurance comparables en conditions réelles ouvertes. La prochaine étape pour Honor n'a pas été annoncée officiellement, mais le positionnement robotique s'inscrit clairement dans sa stratégie IA et écosystème device.

UEL'avance prise par les acteurs chinois en endurance autonome en conditions réelles accentue le retard compétitif des acteurs européens et français du secteur humanoïde, sans impact réglementaire ou commercial direct à court terme.

Chine/AsieOpinion

Aussi sur TechNode

99SCMP Tech

Le vainqueur du semi-marathon robotique de Pékin bat le record mondial humain de 6 minutes

Un robot humanoïde surnommé Lightning a remporté dimanche un semi-marathon organisé à Beijing en 50 minutes et 26 secondes, effaçant de plus de six minutes le record du monde masculin détenu par l'Ougandais Jacob Kiplimo depuis 2021 (57:20). La machine a été développée par Honor, groupe chinois spécialisé jusqu'ici dans les smartphones et l'électronique grand public, qui n'a intégré le secteur de la robotique humanoïde que l'année dernière. La course réunissait plusieurs équipes chinoises engagées dans la compétition d'endurance bipède, reflet d'un agenda industriel clairement orchestré par Pékin pour démontrer la maturité de ses plateformes. Ce résultat mérite d'être contextualisé avec prudence : battre un record humain sur une course longue distance est une performance d'endurance mécanique et de gestion thermique, pas nécessairement de dextérité ou d'adaptabilité en environnement non contrôlé. Le parcours, le revêtement, les conditions météo et l'assistance logistique accordée aux robots ne sont pas encore communiqués en détail, ce qui rend la comparaison directe avec les athlètes humains incomplète. Cela dit, franchir 21 km en locomotion bipède sans chute ni assistance représente un jallon d'endurance réel, pertinent pour des applications logistiques ou d'inspection prolongée. La performance de Lightning s'inscrit dans une séquence d'événements médiatiques chinois autour de la robotique humanoïde, après le marathon de robots de Pékin en avril 2025, qui servent à la fois de bancs d'essai et de vitrines diplomatiques. Honor concurrence sur ce terrain des acteurs bien plus établis comme Unitree, Fourier Intelligence ou le consortium derrière Tiangong. À l'international, Boston Dynamics, Figure et Agility Robotics misent davantage sur la démonstration en environnement industriel que sur la performance sportive. Les prochaines étapes pour Honor et ses concurrents seront de documenter ces robots dans des contextes opérationnels réels plutôt que sur piste.

Chine/AsieActu

Aussi sur TechCrunch Robotics,TechNode,The Verge

100Pandaily

JD.com Launches “Robot Ambulance” Service, Targets 50 Cities in Three Years

JD.com, le géant chinois du e-commerce, a lancé officiellement son service baptisé "robot ambulance", un réseau de maintenance et de réparation dédié aux robots commerciaux. Le service couvre les robots humanoïdes, quadrupèdes et robots compagnons IA, et propose une gamme complète de prestations : diagnostics de pannes, remplacement de batteries, tests de performance, maintenance esthétique et recyclage d'équipements. Déjà opérationnel à Pékin, le dispositif doit s'étendre à plus de 50 grandes villes chinoises d'ici trois ans. JD.com vise également une expansion internationale vers l'Europe, l'Amérique du Nord, le Moyen-Orient et l'Asie-Pacifique, avec des opérations déjà amorcées dans certains pays européens. Pour soutenir cette croissance, l'entreprise s'est fixé l'objectif de recruter plus de 10 000 ingénieurs spécialisés en robotique sur la même période. Ce lancement signale une mutation structurelle dans l'industrie robotique chinoise : le marché ne se limite plus à la fabrication et à la vente de robots, il génère désormais une demande de services après-vente à l'échelle industrielle. Pour les intégrateurs et les opérateurs B2B qui déploient des flottes humanoïdes ou quadrupèdes, l'absence d'infrastructure de maintenance fiable reste l'un des principaux freins à l'adoption. En positionnant une offre de service centralisée et multi-marques, JD.com comble un vide réel, tout en consolidant sa position de plateforme logistique dans l'écosystème robot. C'est aussi un signal que le volume de robots déployés en conditions réelles est désormais suffisant pour justifier une économie de la maintenance. JD.com n'est pas un acteur robotique au sens strict : c'est un opérateur logistique qui utilise des robots dans ses propres entrepôts depuis des années, et qui capitalise maintenant sur cette expertise opérationnelle pour en faire un service tiers. Les partenariats annoncés avec Unitree Robotics, Songyan Dynamics, Deep Robotics et AGIBOT, tous des acteurs majeurs du marché humanoïde et quadrupède chinois, donnent au service une couverture multi-constructeurs crédible. Aucun équivalent de cette échelle n'existe à ce jour en Europe, où des acteurs comme Enchanted Tools ou Wandercraft opèrent encore sans réseau de service structuré. La prochaine étape déclarée est l'extension internationale, dont le calendrier précis reste à confirmer.

UEJD.com ayant déjà amorcé des opérations dans certains pays européens, ce service crée une pression compétitive sur les intégrateurs européens et signale un vide structurel dans l'offre de maintenance de flottes robotiques en Europe.

Chine/AsieOpinion

Aussi sur TechNode