Aller au contenu principal

Dossier Unitree — page 2

345 articles · page 2 sur 7

Unitree, l'humanoïde et quadrupède chinois low-cost : G1, H1, R1, prix grand public sur AliExpress, démonstrations agressives en vidéo et impact sur les concurrents premium.

Vidéo du vendredi : la découverte de mouvements robotiques révèle des comportements inattendus
51IEEE Spectrum Robotics RecherchePaper

Vidéo du vendredi : la découverte de mouvements robotiques révèle des comportements inattendus

La semaine robotique de mi-juin 2026 a été marquée par la présentation de MotionDisco, un framework conçu pour découvrir des comportements de loco-manipulation "contact-rich" sur des horizons longs, sans recourir à la téléopération ni au retargeting de démonstrations humaines. Contrairement aux approches classiques fondées sur des milliers d'exemples capturés par mocap, MotionDisco génère ces comportements moteurs à partir de zéro en explorant l'espace des configurations physiques de manière autonome. Les séquences produites incluent des comportements qualifiés d'"atypiques" même par leurs auteurs, dont certains surprennent par leur aspect non-anthropomorphe. En parallèle, ROBOTIS a dévoilé AI Sapiens, un pipeline permettant à un humanoïde d'apprendre des mouvements depuis une vidéo capturée par smartphone, sans équipement de motion capture professionnel, avec une mise en open source annoncée. LUMOS Robotics a lancé Project EDGE en proposant 100 robots NIX gratuits à des partenaires universitaires et laboratoires sélectionnés à l'échelle mondiale. L'ESA a diffusé un timelapse du robot Dextre, positionné en bout de Canadarm2 sur l'ISS, opéré depuis le sol pour décharger des équipements depuis le compartiment non pressurisé de la capsule Dragon de SpaceX. L'intérêt de MotionDisco pour les équipes d'ingénierie tient à sa promesse de contourner le principal goulot d'étranglement du développement en robotique humanoïde : la collecte de données de démonstration. Les approches VLA (Vision-Language-Action) et les méthodes par imitation requièrent des volumes importants de données de haute qualité, coûteuses à produire par téléopération ou mocap. Un framework capable de "découvrir" des comportements moteurs complexes sans données humaines initiales réduirait ce coût d'entrée, avec un impact direct pour les intégrateurs qui externalisent aujourd'hui cette phase à des prestataires spécialisés. Cela dit, aucune métrique de robustesse, de taux de succès ni de généralisation n'est fournie dans la présentation publique, ce qui limite l'interprétation : les vidéos sélectionnées montrent des résultats visuellement convaincants, pas une validation de déploiement. L'annonce d'AI Sapiens par ROBOTIS signale une démocratisation possible du motion learning : si un smartphone suffit pour entraîner un humanoïde, le besoin en infrastructure de mocap type Vicon ou OptiTrack disparaît pour les laboratoires à budget limité. MotionDisco s'inscrit dans un axe de recherche en expansion depuis 2024, porté par des travaux comme DeepMimic (UC Berkeley) et AMP (Adversarial Motion Priors), qui cherchent à automatiser la génération de comportements locomoteurs sans supervision humaine directe. ROBOTIS, fabricant coréen connu pour la gamme de servos Dynamixel et ses plateformes humanoïdes éducatives (OP3, DARWIN), positionne AI Sapiens comme une brique accessible pour les labos dépourvus de pipelines téléopérés coûteux, face à des acteurs comme Unitree ou Fourier Intelligence qui misent eux aussi sur la réduction du coût de collecte de données. LUMOS Robotics reste peu documentée publiquement : Project EDGE ressemble davantage à un programme d'early adopters qu'à un déploiement commercial établi. Les opérations Dextre sur l'ISS rappellent que la téléopération spatiale demeure le segment le plus mature pour la manipulation dextère à distance dans des conditions réelles contraintes. Les étapes à surveiller : la publication éventuelle du code MotionDisco et le calendrier de la mise en open source du pipeline ROBOTIS.

UEL'ESA est le seul acteur européen cité, avec une opération de routine du robot Dextre sur l'ISS ; aucun impact opérationnel ou commercial direct pour la France ou l'UE.

1 source
GenHOI : interaction humanoïde-objet sensible aux contacts par imitation de vidéos générées, sans entraînement spécifique
52arXiv cs.RO 

GenHOI : interaction humanoïde-objet sensible aux contacts par imitation de vidéos générées, sans entraînement spécifique

Une équipe de chercheurs propose GenHOI (arXiv:2606.12995, juin 2026), un cadre logiciel permettant à des robots humanoïdes d'interagir avec des objets variés en mode zéro-shot, sans entraînement spécifique à la tâche ni données de démonstration physique. Le système prend en entrée une commande en langage naturel et une image du premier plan de la scène robot-objet reconstruite en simulation, à partir desquels un modèle génératif produit une vidéo d'interaction synthétique orientée tâche. Cette vidéo est analysée pour identifier les événements de contact pertinents et estimer les régions de contact main-objet, encodés sous forme de contraintes géométriques centrées sur l'objet. Ces contraintes servent de priors d'optimisation pour raffiner la trajectoire de référence extraite de la vidéo 2D, résolvant l'ambiguïté d'échelle inhérente à la génération vidéo, et adaptent une trajectoire unique à des poses relatives robot-objet non vues à l'entraînement. Un contrôleur de suivi en boucle fermée assure l'exécution finale. Les tâches validées en simulation et en réel incluent la saisie de boîtes, le transport bimanuel asymétrique d'une chaise, le soulèvement d'une table par en-dessous et l'enveloppement d'objets cylindriques. Il s'agit d'un preprint académique, pas d'un produit déployé. L'enjeu central est la rupture avec le paradigme d'entraînement par tâche, principal goulot d'étranglement du déploiement industriel des humanoïdes. Les approches existantes exigent soit des centaines d'heures de collecte de démonstrations physiques par tâche, soit rejouent des trajectoires rigides incapables de s'adapter à des variations de pose ou d'objet. GenHOI contourne ces deux limites en substituant la génération vidéo à la démonstration réelle, tout en maintenant une conscience physique du contact via des contraintes géométriques explicites. La capacité d'adaptation à des configurations inédites robot-objet sans réentraînement est particulièrement significative pour les intégrateurs industriels devant déployer rapidement un humanoïde sur de nouvelles références produit. La problématique de l'interaction humanoïde-objet est activement travaillée par plusieurs acteurs concurrents : Physical Intelligence avec Pi-0, NVIDIA avec GR00T N2, et les équipes de Figure AI ou Boston Dynamics opèrent dans un espace voisin, mais s'appuient majoritairement sur du fine-tuning tâche par tâche ou du reinforcement learning avec simulateurs massivement parallèles. GenHOI se positionne comme une approche complémentaire, plus légère en données, exploitant la capacité des générateurs vidéo récents à produire des séquences physiquement plausibles. La principale limite non adressée est la robustesse à l'échelle sur des centaines de tâches distinctes et la gestion des objets déformables. Les prochaines étapes naturelles seraient une évaluation sur des plateformes commerciales comme l'Unitree G1 ou l'Agility Digit, et une intégration avec des policies de bas niveau plus génériques.

IA physiqueOpinion
1 source
Voir de façon sélective, agir de façon adaptative : décomposition structurelle à deux niveaux pour la manipulation bimanuelles par robot
53arXiv cs.RO 

Voir de façon sélective, agir de façon adaptative : décomposition structurelle à deux niveaux pour la manipulation bimanuelles par robot

Une équipe de chercheurs a publié le 16 juin 2026 (arXiv:2606.13279) un nouveau cadre VLA pour la manipulation bimanuelles robotique, baptisé "Dual-Level Structural Decomposition". L'architecture repose sur deux modules distincts : un "View-Selective Visual Router" qui pondère dynamiquement la contribution de chaque caméra de poignet selon le contexte de la tâche, et un générateur d'actions basé sur un Mixture-of-Experts (MoE) qui sépare explicitement les trajectoires coordonnées (les deux bras agissent ensemble) des trajectoires indépendantes (chaque bras opère séparément). Évalué sur six tâches bimanuelles simulées dans l'environnement RoboTwin 2.0 et trois tâches longues en conditions réelles, le système affiche un gain de 27,7 % de taux de réussite moyen en simulation et de 43,3 % en déploiement physique par rapport à une baseline VLA monolithique équivalente. Ces résultats interpellent directement les équipes qui développent des politiques de contrôle pour robots humanoïdes ou manipulateurs industriels à deux bras. La progression de 43 % en real-world est significative car elle s'applique à des tâches dites "long-horizon", c'est-à-dire enchaînant plusieurs sous-étapes, là où les VLA monolithiques accumulent les erreurs. Le choix du MoE comme mécanisme de décomposition est notable : plutôt que d'entraîner deux politiques séparées, le modèle apprend à router dynamiquement selon le mode d'interaction détecté, ce qui limite l'explosion du coût d'inférence. Cela valide partiellement l'hypothèse que la structure de l'interaction bimanuele est un biais inductif exploitable -- et que les architectures "tout-en-un" atteignent leurs limites sur ces configurations. Les VLA bimanuelles constituent un chantier actif depuis l'essor des modèles de fondation robotiques en 2024-2025. Des systèmes comme Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) ciblent déjà la manipulation généraliste, mais traitent souvent l'entrée visuelle et la génération d'action de façon uniforme. Ce travail s'inscrit dans une tendance plus large vers des architectures modulaires, aux côtés d'initiatives comme RoboTwin 2.0 lui-même, qui sert ici de benchmark standardisé. Les prochaines étapes naturelles seraient un test sur des robots humanoïdes commerciaux (Figure 03, Unitree H1) ou une intégration dans des cellules industrielles bimanuelles -- les auteurs ne mentionnent pas de partenariat industriel ni de timeline de transfert dans la version preprint.

IA physiqueOpinion
1 source
Perception sémantique active
54arXiv cs.RO 

Perception sémantique active

Des chercheurs ont publié sur arXiv (2510.05430v2) une méthode de perception sémantique active permettant à un robot mobile d'explorer un environnement intérieur en raisonnant sur les zones qu'il n'a pas encore observées. Le système construit un graphe de scène multi-couches et compact, structurant l'environnement à plusieurs niveaux d'abstraction : pièces, objets, murs, fenêtres, avec leur géométrie fine. En s'appuyant sur un grand modèle de langage (LLM), le pipeline génère des graphes de scène plausibles pour les régions inexplorées, en maintenant la cohérence avec les observations partielles déjà accumulées. L'approche calcule ensuite le gain d'information attendu à chaque point de passage candidat, afin de guider la trajectoire d'exploration. Les expériences ont été menées à la fois en simulation sur des appartements 3D réalistes et sur un robot quadrupède Unitree Go 2 en conditions réelles. L'intérêt principal de cette approche réside dans la capacité à exploiter des connaissances sémantiques commonsense pour anticiper la topologie d'une scène non encore visitée. Plutôt que de se limiter à une cartographie géométrique réactive, le robot raisonne sur la probabilité qu'une porte donne sur une cuisine plutôt qu'une chambre selon le contexte observé, un type de raisonnement spatial jusqu'ici difficile à formaliser en robotique mobile. Pour les intégrateurs d'AMR (autonomous mobile robots) et les équipes R&D en navigation intérieure, cette architecture ouvre la voie à des explorations plus efficaces dans des environnements inconnus, avec moins de déplacements redondants. Les résultats quantitatifs montrent une localisation plus rapide et plus précise des informations sémantiques hautes et basses résolutions par rapport aux méthodes existantes, bien que les benchmarks retenus méritent une lecture critique puisqu'ils restent essentiellement contrôlés par les auteurs. Ce travail s'inscrit dans un courant actif combinant graphes de scène hiérarchiques et LLMs pour la navigation sémantique, aux côtés de travaux comme SayPlan (Rana et al.) ou SceneGraph-Nav. Le Unitree Go 2, robot quadrupède à faible coût devenu plateforme standard pour la recherche en mobilité intérieure, sert ici de démonstrateur physique. Les acteurs concurrents incluent les approches par représentations neurales implicites (NeRF sémantiques) et les méthodes de frontier-based exploration enrichies par vision-langage. Le code n'est pas encore publié à la date de soumission, et aucun partenariat industriel ni calendrier de transfert n'est mentionné dans le papier.

RecherchePaper
1 source
Y-BotFrame : un cadre extensible d'agents incarnés pour robots quadrupèdes assistants
55arXiv cs.RO 

Y-BotFrame : un cadre extensible d'agents incarnés pour robots quadrupèdes assistants

Des chercheurs du groupe XDEI ont publié en juin 2026, via arXiv (2606.13049), les spécifications de Y-BotFrame, un framework open-source conçu pour transformer un robot quadrupède générique en assistant mobile autonome piloté par le langage naturel. L'architecture intègre trois modalités de perception en parallèle, microphone (commandes vocales), caméra RGB-D (vision) et LiDAR (cartographie 3D), et repose sur un grand modèle de langage (LLM) comme noyau cognitif central. Ce LLM prend en charge la compréhension de l'environnement, le raisonnement contextuel et la planification de tâches, puis convertit les instructions en langage naturel en unités d'action exécutables par le robot. Le système supprime le besoin d'une télécommande physique, remplacée par une interface voix et un retour visuel temps réel. Il s'agit pour l'instant d'une annonce académique accompagnée d'une vidéo de démonstration, pas d'un produit commercialisé. L'intérêt industriel de Y-BotFrame réside dans son architecture modulaire dite "plug-and-play" : chaque sous-système (navigation, perception, interaction) peut être remplacé ou mis à niveau indépendamment, ce qui abaisse le coût d'intégration pour des déploiements sectoriels spécifiques (inspection, logistique d'entrepôt, assistance en environnement structuré). La chaîne voix-vers-action sans contrôleur dédié réduit la barrière de qualification opérateur, un argument concret pour les déployeurs B2B. Reste que les métriques de performance concrètes, latence de la boucle LLM, robustesse en conditions dégradées, autonomie, sont absentes du résumé publié, ce qui est typique des papiers arXiv en phase préliminaire. Les robots quadrupèdes à LLM embarqué forment un segment en effervescence : Unitree (Go2, H1) et Boston Dynamics (Spot) dominent le hardware, tandis que des frameworks comme LeRobot (HuggingFace), Open-X Embodiment ou π₀ (Physical Intelligence) se disputent la couche logicielle d'apprentissage généraliste. Y-BotFrame se positionne non pas comme un modèle VLA entraîné, mais comme une couche d'orchestration système, plus proche de ROS 2 avec un LLM que d'un modèle de politique end-to-end. La prochaine étape logique pour l'équipe XDEI sera de publier des benchmarks sur un hardware cible identifié et des résultats de déploiement réel hors laboratoire.

RecherchePaper
1 source
Hello Robot reconnue par le Forum économique mondial comme pionnière technologique
56The Robot Report 

Hello Robot reconnue par le Forum économique mondial comme pionnière technologique

Le Forum Économique Mondial a désigné Hello Robot Inc. comme "Technology Pioneer 2026" le 10 juin 2026, intégrant l'entreprise californienne (Martinez, CA) dans la cohorte annuelle de 100 startups sélectionnées pour leur impact sur les industries et la société. Hello Robot développe le robot mobile manipulateur Stretch, un système open-source sur roues doté d'un bras télescopique conçu pour opérer en proximité directe avec des humains dans des environnements domestiques, médicaux et professionnels. Fondée en 2017 par Aaron Edsinger et Charlie Kemp, deux chercheurs cumulant plus de 50 ans d'expérience combinée en robotique (MIT, Google, Georgia Tech), la société a présenté en mai 2026 la quatrième génération de Stretch, une refonte majeure pilotée par les retours utilisateurs. Le robot est actuellement déployé dans des centaines de sites académiques, de recherche et d'entreprises, et fait l'objet de pilotes auprès de personnes atteintes de handicaps moteurs sévères, dont des cas de quadriplégie, qui le pilotent via une application mobile pour accomplir des tâches quotidiennes : aller chercher un verre d'eau, se nourrir, fermer des stores. La reconnaissance du WEF illustre un glissement de perception dans le secteur robotique : après des années dominées par les démonstrations spectaculaires de robots humanoïdes ou industriels, un intérêt croissant se porte vers les systèmes à utilité directe et déployable. Pour les intégrateurs et les décideurs du secteur de la santé ou du maintien à domicile, Stretch représente un cas d'usage concret et mesurable : augmentation de l'autonomie des patients, réduction de la charge sur les aidants, et compatibilité avec des environnements non structurés (domiciles réels, pas des labs). Là où la plupart des déploiements humanoïdes restent en phase pilote contrôlée en environnement industriel, Hello Robot documente des usages réels chez des utilisateurs à domicile, ce qui en fait un point de référence pour le "reality gap" entre démos et terrain. Hello Robot s'inscrit dans une catégorie distincte du champ robotique actuel, dominé par les humanoïdes industriels (Figure, 1X, Agility, Unitree, Tesla Optimus) et les AMR logistiques (Boston Dynamics Spot, Exotec). Stretch cible un segment sous-investi : l'assistance à la personne dans des environnements non industriels. La société avait déjà été distinguée par le RBR50 Robotics Innovation Award en 2025 pour la version Stretch 3. Avec Stretch 4 lancé en mai 2026 et cette labellisation WEF, Hello Robot consolide sa position de référence dans la robotique d'assistance personnelle. Les prochaines étapes probables incluent une expansion des pilotes cliniques et domestiques, ainsi qu'une potentielle recherche de financement adossée à cette visibilité institutionnelle, dans un contexte où les financeurs institutionnels et les systèmes de santé européens s'intéressent de plus en plus aux robots d'assistance à domicile.

UELes systèmes de santé et financeurs institutionnels européens, en recherche active de solutions de maintien à domicile, peuvent s'appuyer sur les pilotes documentés de Stretch 4 comme référence concrète pour évaluer la maturité de la robotique d'assistance personnelle.

BusinessOpinion
1 source
Des voitures électriques aux humanoïdes : le PDG de Xpeng prend la tête de la division robotique
57SCMP Tech 

Des voitures électriques aux humanoïdes : le PDG de Xpeng prend la tête de la division robotique

He Xiaopeng, président-directeur général de Xpeng, constructeur chinois de véhicules électriques coté à New York, a annoncé mercredi 11 juin 2026 dans un mémo interne révélé par le South China Morning Post qu'il prendrait personnellement la direction du département robotique de l'entreprise. Ce pivot de gouvernance intervient à quelques mois d'une phase de production de masse des humanoïdes Xpeng, que He décrit comme un "tournant" stratégique dans la trajectoire de la firme vers le "physical AI", terme qu'il utilise pour désigner la fusion entre intelligence artificielle embarquée et systèmes physiques autonomes. La décision d'un PDG de descendre directement au niveau d'un département opérationnel est rare dans l'industrie automobile, et elle envoie un signal fort aux investisseurs et aux équipes d'ingénierie : la robotique humanoïde n'est plus un projet de R&D périphérique chez Xpeng, mais un axe de croissance prioritaire. Pour les intégrateurs industriels et les décideurs B2B, cela suggère une accélération du calendrier de commercialisation et une consolidation des ressources autour du programme humanoïde, avec un soutien en capital et en légitimité que peu de labs robotiques indépendants peuvent égaler. Xpeng s'inscrit dans une vague de constructeurs automobiles chinois qui convertissent leurs capacités de fabrication à grande échelle en avantage compétitif pour la robotique -- une trajectoire similaire à celle de BYD et SAIC qui investissent dans des joint-ventures robotiques. Ses concurrents directs sur le segment humanoïde incluent UBTECH, Fourier Intelligence et Unitree en Chine, et Tesla avec Optimus à l'international. La prochaine étape visible sera l'annonce officielle des volumes de production et des premiers clients industriels, probablement lors d'un événement de communication au second semestre 2026.

Chine/AsieOpinion
1 source
Xingyuanzhi Robot lève 1 milliard de yuans en 10 mois pour son IA physique intégrée
58Pandaily 

Xingyuanzhi Robot lève 1 milliard de yuans en 10 mois pour son IA physique intégrée

Fondée en septembre 2025 à Pékin et incubée par la Beijing Academy of Artificial Intelligence (BAAI), Xingyuanzhi Robot a levé 1 milliard de yuans (environ 140 millions de dollars) en moins de dix mois, dont la dernière tranche bouclée début juin 2026. L'entreprise compte une cinquantaine d'employés dont plus de 90 % en R&D, et a déjà généré plus de 10 millions de yuans de chiffre d'affaires en 2025 en livrant plusieurs centaines d'unités de sa plateforme T5, un contrôleur de domaine haute performance couplé à des modèles d'IA embarquée capables d'inférence en temps réel sur edge, sans dépendance au cloud. Son CEO, Liu Dong, ancien directeur général de la conduite autonome chez JD.com, est épaulé par le co-fondateur Mu Yadong, professeur à l'Université de Pékin et chercheur au BAAI spécialisé en IA incarnée. Parmi les clients déjà acquis figurent AgiBot, l'un des principaux développeurs chinois de robots humanoïdes, ainsi que Beijing Yizhuang Robot, avec qui un partenariat stratégique représente un carnet de commandes annoncé à plus de 500 millions de yuans sur trois ans. Sur le segment des équipements industriels, Xingyuanzhi développe avec EP Equipment, fabricant de chariots élévateurs électriques, des solutions de chargement et déchargement autonomes basées sur son système RoboBrain Pro. Le modèle économique de Xingyuanzhi est délibérément "brain-only" : l'entreprise ne fabrique aucun châssis ni actionneur, et se positionne exclusivement comme fournisseur de la couche intelligence pour des intégrateurs et fabricants tiers. Ce positionnement est directement calqué sur la stratégie de Huawei dans le véhicule électrique, où le groupe fournit la plateforme logicielle et les systèmes ADAS sans produire de voitures. Pour les industriels et intégrateurs robotiques, ce modèle signifie une possible convergence vers un middleware standardisé de l'IA incarnée en Chine, réduisant le coût et la complexité d'intégration de la perception et du contrôle dans des robots hétérogènes. La capacité à déployer de l'inférence sur edge sans infrastructure cloud est un argument opérationnel concret dans des environnements d'entrepôts ou de lignes de production à connectivité contrainte. Reste à noter que les métriques commerciales annoncées, notamment le carnet de commandes Yizhuang Robot et les volumes T5 livrés, proviennent de communications de la startup elle-même et n'ont pas été vérifiées indépendamment. Dans le contexte de la course chinoise aux robots humanoïdes et à l'IA physique, Xingyuanzhi arrive dans un écosystème déjà dense : Unitree, AgiBot, LimX Dynamics et Agilex côté hardware, tandis que des plateformes logicielles comme Zhiyuan Robotics et des laboratoires universitaires cherchent également à occuper la couche middleware. L'angle BAAI donne à Xingyuanzhi une crédibilité académique forte et un accès aux réseaux de financement publics pékinois. La levée d'un milliard de yuans en dix mois traduit l'appétit des investisseurs chinois pour la thèse de l'IA incarnée comme secteur stratégique, dans un contexte de politiques industrielles nationales orientées vers l'autonomisation robotique des usines et entrepôts. Les prochaines étapes probables incluent le passage à l'échelle de la plateforme T5, l'extension aux marchés de la logistique et de la fabrication, et potentiellement une consolidation via des partenariats avec des équipementiers plus larges.

Chine/AsieOpinion
1 source
AgniNav : planification locale multi-plateforme pilotée par configuration pour la navigation robotique
59arXiv cs.RO 

AgniNav : planification locale multi-plateforme pilotée par configuration pour la navigation robotique

Une équipe de recherche a publié en juin 2026 sur arXiv (référence 2606.10903) un framework de navigation locale appelé AgniNav, conçu pour permettre à des robots de morphologies radicalement différentes de naviguer en autonomie à partir d'une unique caméra RGB, sans recourir à un capteur de profondeur actif et sans réentraînement du modèle. Le système repose sur une enveloppe de sécurité définie par quatre paramètres mesurables : hauteur critique pour la détection de collisions, longueur avant, longueur arrière, demi-largeur. Ces paramètres conditionnent simultanément un réseau image-vers-scan qui prédit un pseudo-laserscan 1D à partir d'une image couleur monoculaire, et un planificateur local qui adapte la vérification de collisions au gabarit du robot. Les expérimentations ont été conduites sur trois plateformes réelles : le Turtlebot2 (base à roues), l'Unitree Go2 (quadrupède), et l'Accelerated Evolution K1 (humanoïde). Les taux de succès sont respectivement de 39/40, 18/20 et 18/20, avec 0, 1 et 2 collisions sur l'ensemble des essais, le tout tournant à 30 Hz sur un Jetson Orin. Ce qui distingue AgniNav des travaux existants est précisément l'absence de retraining par plateforme. La quasi-totalité des politiques de navigation visuelle actuelles sont entraînées pour un couple caméra/gabarit fixe, ce qui rend leur transfert d'un robot à un autre coûteux en données et en temps. Ici, le même réseau, entraîné une fois sur des paires couleur-profondeur supervisées par des labels de scan générés à la volée, se déploie sans adaptation sur des morphologies aussi différentes qu'un rover plat et un humanoïde. Pour un intégrateur gérant une flotte hétérogène, ou pour un OEM souhaitant embarquer la navigation sur plusieurs SKUs avec un seul modèle, c'est un changement d'économie non négligeable. La navigation cross-embodiment est un problème ouvert depuis plusieurs années dans la communauté robotique : les approches concurrentes, comme celles mobilisant des politiques VLA (vision-language-action) ou des pipelines basés sur la simulation, exigent généralement soit du matériel dédié (LiDAR, caméra de profondeur RGB-D), soit des cycles de fine-tuning par plateforme. AgniNav s'inscrit dans un courant de travaux cherchant à normaliser la couche de perception au niveau de l'enveloppe physique plutôt que du modèle de robot complet. Le résultat présenté reste à ce stade une contribution de recherche, pas un produit ou un SDK distribué. Les prochaines étapes naturelles incluent la validation sur des environnements dynamiques et des densités d'obstacles plus élevées, ainsi que l'extension à des architectures d'enveloppe plus complexes pour les humanoïdes à forte variation de posture.

RecherchePaper
1 source
Transfert de trajectoires humain-robot centré sur la main à partir de vidéos via localisation de contacts en monde ouvert
60arXiv cs.RO 

Transfert de trajectoires humain-robot centré sur la main à partir de vidéos via localisation de contacts en monde ouvert

Des chercheurs ont publié sur arXiv (arXiv:2606.10743, juin 2026) HOWTransfer, un cadre algorithmique centré sur la main pour transférer des démonstrations humaines filmées en trajectoires exécutables par un bras robotique. Le système fonctionne en trois étapes : reconstruction 3D temporellement cohérente du mouvement du poignet humain, localisation automatique des intervalles de contact main-objet à partir de cues visuels d'interaction, puis génération d'hypothèses de saisie en pince parallèle (parallel-jaw grasp) propagées le long de la trajectoire du poignet. Une phase finale d'édition raffine l'alignement de contact et produit plusieurs variantes exécutables depuis une seule vidéo de démonstration. Sur un ensemble de tâches de manipulation variées, le système atteint 86 % de taux de succès et est préféré aux trajectoires téléopérées dans une étude comparative en aveugle. Ce résultat mérite attention parce qu'il attaque directement le goulot d'étranglement principal du learning from demonstration (LfD) : collecter suffisamment de données de qualité. La téléopération reste coûteuse, lente et non scalable en industrie ; si un système peut extraire des trajectoires robotes directement depuis des vidéos de travailleurs humains filmés sur une chaîne d'assemblage ou en entrepôt, le coût d'entrée pour déployer de la manipulation apprise s'effondre. Fait notable : HOWTransfer ne s'appuie pas sur des descripteurs d'objets prédéfinis ni sur un tracking d'état explicite, ce qui le rend potentiellement généraliste sur des objets non vus. Le 86 % de succès annoncé est encourageant, mais les conditions expérimentales exactes (diversité des objets, profondeur de la caméra, nombre de tâches, robot cible) ne sont pas précisées dans le résumé, ce qui justifie une lecture du papier complet avant toute intégration industrielle. Le transfert de démonstration humaine vers robot via vidéo est un domaine en pleine effervescence depuis 2022-2023, porté par des travaux comme DROID, RoboAgent ou les approches VLA (Vision-Language-Action) de Google DeepMind et Physical Intelligence (Pi-0). HOWTransfer se distingue en adoptant une approche sans modèle de langage ni segmentation objet, ce qui le rend plus léger mais aussi plus fragile sur les scènes encombrées. Aucune affiliation industrielle ni partenariat de déploiement n'est mentionné : il s'agit pour l'instant d'un preprint académique, pas d'un produit. Les prochaines étapes naturelles seraient une validation sur des robots commerciaux (Franka, UR, ou humanoïdes comme Figure 03 ou Unitree G1) et une évaluation sur des benchmarks standardisés comme RLBench ou LIBERO pour situer la performance par rapport à l'état de l'art.

RecherchePaper
1 source
Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée
61arXiv cs.RO 

Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée

Un groupe de chercheurs a publié sur arXiv (réf. 2505.01458, version 2, mai 2025) un état de l'art sur l'utilisation des simulateurs physiques pour entraîner des robots à la navigation et à la manipulation dans le cadre de l'IA incarnée (Embodied AI). L'étude analyse comment les moteurs de simulation réduisent le "sim-to-real gap", c'est-à-dire l'écart de performance constaté quand un agent entraîné en simulation est déployé dans le monde réel. Le survey passe en revue les caractéristiques des principaux simulateurs, leurs contraintes matérielles, et propose un inventaire structuré de datasets de référence, métriques d'évaluation et méthodes existantes. Aucun code ou outil nouveau n'est publié: il s'agit d'une contribution bibliographique et méthodologique. Cette revue intervient alors que le sim-to-real gap demeure l'obstacle principal au déploiement industriel de robots humanoïdes et de bras manipulateurs. Entraîner directement sur du matériel réel est coûteux, lent et risqué, ce qui place la simulation au cœur des pipelines de développement des VLA (Vision-Language-Action models) et des systèmes de navigation autonome. En consolidant des propriétés peu documentées des simulateurs, le survey aide ingénieurs et chercheurs à sélectionner l'outil adapté à leurs contraintes hardware sans avoir à faire une veille exhaustive de la littérature. Les simulateurs en compétition dans cet espace incluent Isaac Sim (NVIDIA), MuJoCo (DeepMind/Google), PyBullet, Webots et Genesis, un moteur GPU-natif récent. L'intérêt pour ce type de synthèse est alimenté par l'accélération du secteur: Figure AI, Physical Intelligence (pi zero), Boston Dynamics, Unitree et Agility Robotics multiplient les annonces de déploiements en environnements industriels réels. Ce survey constitue un point d'entrée structuré pour les équipes qui montent leur pipeline sim-to-real en 2025, à condition de ne pas attendre de benchmarks neutres et indépendants: l'évaluation des simulateurs reste largement conduite par leurs propres éditeurs.

RecherchePaper
1 source
Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger
62Pandaily 

Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger

Le robot humanoïde G1 de Unitree Robotics est devenu en quelques semaines un phénomène viral mondial, déployé dans des contextes radicalement différents selon les pays. En Corée du Sud, un G1 a été ordonné moine bouddhiste au temple Jogyesa de Séoul sous le nom de "Gabi", revêtu d'une robe monastique grise et d'un chapelet, ayant reçu les cinq préceptes dont l'interdiction de "surcharger" -- précepte que les journalistes coréens ont vérifié techniquement, confirmant que le BMS du robot coupe effectivement la charge automatiquement. Au Japon, le temple Seirenji de Kyoto héberge un "Buddharoid" basé sur la même plateforme G1, équipé d'un LLM entraîné sur des sutras et couplé à ChatGPT, capable de mener des séances de conseil individuel avec les visiteurs. En Pologne, un G1 baptisé "Edek" déambule dans Varsovie avec un sac à dos Adidas et une Rolex ornée de diamants, générant du contenu viral en simulant des commandes chez McDonald's, en intervenant à la radio nationale et en prononçant des discours au parlement polonais. Aux États-Unis, "Jake", un G1 customisé en "bro" de l'ère IA avec chapeau de cowboy et chaîne en argent, a déclenché une controverse après une altercation physique avec le streameur IShowSpeed, aboutissant à des accusations d'agression et à une plainte en justice à hauteur d'un million de dollars déposée par sa société de management, RizzBot. Ces déploiements révèlent une dynamique inattendue : le G1 de Unitree, commercialisé autour de 16 000 dollars, s'avère suffisamment accessible pour que des acteurs indépendants -- temples, créateurs de contenu, agences de divertissement -- l'intègrent sans soutien industriel lourd. Le robot humanoïde devient ainsi un vecteur de présence culturelle avant d'être un outil de productivité. Pour les décideurs et intégrateurs, ce phénomène signale que la barrière à l'adoption n'est plus uniquement technique ou financière, mais narrative : le premier humanoïde qui capte l'attention devient une référence de marché, indépendamment de ses capacités réelles en manipulation ou locomotion. Ces usages ne prouvent pas la résolution du sim-to-real gap ni la viabilité industrielle -- les vidéos restent sélectionnées, les environnements contrôlés -- mais ils démontrent que la forme humanoïde génère une adhésion sociale difficile à obtenir avec les AMR classiques. Unitree Robotics, fondée en 2016 à Hangzhou, s'est imposée dans le segment des robots quadrupèdes bon marché avant de lancer le G1 en 2024 comme humanoïde d'entrée de gamme. La société évolue dans un écosystème concurrentiel dense : Figure AI (Figure 03), Boston Dynamics (Atlas), 1X Technologies, et côté chinois Agibot, Fourier Intelligence et UBTECH, tous positionnés sur des segments industriels avec des arguments de payload et de robustesse que le G1 ne revendique pas. La stratégie de Unitree semble délibérément différente -- volume, prix, accessibilité -- et ces déploiements viraux, qu'ils soient spontanés ou orchestrés, construisent une notoriété mondiale qui précède toute annonce de pilote industriel formel.

UEUn acteur indépendant polonais déploie déjà le G1 d'Unitree à Varsovie, signalant que la barrière financière à l'adoption d'humanoïdes en Europe est passée sous 20 000€ et accessible à des non-industriels.

Chine/AsieOpinion
1 source
Mettre à l'échelle l'apprentissage par renforcement robotique avec NVIDIA Isaac Lab sur Amazon SageMaker AI
63AWS ML Blog 

Mettre à l'échelle l'apprentissage par renforcement robotique avec NVIDIA Isaac Lab sur Amazon SageMaker AI

NVIDIA et Amazon Web Services ont publié un guide technique détaillant comment entraîner des politiques de comportement pour le robot humanoïde Unitree H1 en utilisant NVIDIA Isaac Lab sur Amazon SageMaker AI. La solution s'appuie sur deux options de calcul complémentaires : SageMaker HyperPod, une infrastructure distribuée managée pour des clusters persistants, et SageMaker Training Jobs, une approche entièrement à la demande où les instances GPU sont provisionnées à la volée puis supprimées à la fin du job. Le code complet est disponible publiquement sur GitHub. L'objectif est de permettre aux équipes robotique de lancer des entraînements par renforcement (RL) à grande échelle, aussi bien en phase d'expérimentation rapide qu'en production sur de longues durées, sans gérer eux-mêmes l'infrastructure de calcul. Cette publication répond à un défi concret : l'entraînement par renforcement pour des comportements complexes, comme la locomotion humanoïde sur terrain accidenté, est extrêmement gourmand en GPU. Un seul run d'entraînement peut durer de quelques heures à plusieurs jours. SageMaker HyperPod intègre un agent de surveillance de santé sur chaque nœud, capable de détecter automatiquement les pannes matérielles, de remplacer les instances défaillantes et de reprendre l'entraînement depuis le dernier checkpoint, sans intervention humaine. Le système publie en parallèle des centaines de métriques de cluster vers Amazon Managed Service for Prometheus, visualisables dans des dashboards Grafana préconfigurés, couvrant l'utilisation GPU, la mémoire, le débit réseau et les performances par tâche. Pour les expériences courtes, SageMaker Training Jobs élimine tout coût de calcul inactif entre les runs, chaque job ne consommant de ressources que le temps de son exécution. L'IA physique bascule progressivement de la recherche vers la production industrielle. Les robots sont désormais formés dans des simulations haute-fidélité accélérées par GPU avant leur déploiement en usine, en entrepôt ou dans des centres logistiques, parce que l'entraînement en conditions réelles reste lent, coûteux et risqué. Cette simulation compresse des mois d'apprentissage en quelques heures, mais déplace le problème vers la gestion du calcul distribué. C'est précisément le créneau que cherchent à occuper AWS et NVIDIA avec cette intégration : en abstraisant la couche infrastructure, ils permettent aux ingénieurs de se concentrer sur la conception des politiques de comportement robotique plutôt que sur la configuration des clusters. SageMaker HyperPod supporte l'orchestration via Amazon EKS ou Slurm, avec un système de quotas fins par instance, GPU entier ou partition MIG (NVIDIA Multi-Instance GPU), couvrant les accélérateurs, les vCPU et la mémoire. La prochaine étape logique sera l'extension de ces pipelines aux modèles de fondation robotique, qui nécessitent des infrastructures similaires mais à une échelle encore supérieure.

HumanoïdesActu
1 source
RLWRLD et Nvidia lancent DexBench pour standardiser la dextérité des robots humanoïdes
64Robotics & Automation News 

RLWRLD et Nvidia lancent DexBench pour standardiser la dextérité des robots humanoïdes

RLWRLD, une startup spécialisée en IA physique, a annoncé en partenariat avec Nvidia le lancement de DexBench, un benchmark universel destiné à standardiser l'évaluation des capacités de dextérité des robots humanoïdes. L'initiative repose sur trois axes : DexBench en tant que référentiel d'évaluation commun, un standard de données pour l'entraînement à la manipulation dextre, et une intégration native aux frameworks open-source Nvidia Isaac Lab et Isaac Lab-Arena. Aucune date de disponibilité publique ni métriques de performance n'ont été communiquées à ce stade -- il s'agit d'une annonce de feuille de route, pas d'un produit shipped. L'absence de standard commun pour mesurer la dextérité est l'un des obstacles majeurs à la comparaison objective entre systèmes humanoïdes. Sans référentiel partagé, chaque constructeur publie ses propres métriques dans des conditions contrôlées, ce qui rend les comparaisons entre Figure 03, Optimus, Unitree ou 1X quasi impossibles pour les intégrateurs industriels. DexBench vise à combler ce vide en établissant des protocoles reproductibles, ce qui pourrait accélérer la qualification de robots pour des tâches d'assemblage ou de picking en milieu non structuré. RLWRLD s'inscrit dans un écosystème naissant autour des fondations de simulation Nvidia, qui positionne Isaac Lab comme infrastructure commune pour le sim-to-real dans la robotique humanoïde. Des acteurs comme Physical Intelligence (Pi-0), Agility Robotics ou Boston Dynamics s'appuient également sur des pipelines de simulation propriétaires. Le choix de standardiser via un framework open Nvidia plutôt qu'un consortium neutre (comme ROS 2 ou IEEE) est un pari sur l'adoption par l'écosystème Jetson/Omniverse -- une dynamique à surveiller face aux initiatives concurrentes en Europe.

UELa standardisation de l'évaluation de la dextérité pourrait indirectement bénéficier aux intégrateurs industriels européens, mais aucun acteur FR/EU n'est impliqué et l'initiative demeure au stade de feuille de route sans métriques ni date de disponibilité.

HumanoïdesOpinion
1 source
Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés
65arXiv cs.RO 

Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés

Des chercheurs proposent une méthode de récupération après chute pour robots humanoïdes sur terrains variés, publiée en juin 2026 sur arXiv (identifiant 2606.08922). Baptisée PTDL (Phase-Terrain Decoupled Learning), elle cible un problème concret : un humanoïde tombé sur du gravier, une pente ou un sol inégal doit non seulement se relever, mais reprendre immédiatement une marche dirigée par commande de vitesse, sans capteurs externes ni étiquettes de terrain fournies au moment de l'exécution. La validation porte sur le Unitree G1, humanoïde commercial de 29 degrés de liberté, testé en simulation et sur robot réel, sur sol plat, gravier et inclinaisons allant jusqu'à 20 degrés. L'architecture de PTDL repose sur une double décorrélation. Sur l'axe des phases, des discriminateurs de mouvement à double prior conditionnés par la gravité projetée lient la récupération post-chute à la reprise de locomotion normale. Sur l'axe des terrains, un façonnage de récompense stratifié par surface applique des supervisions d'entraînement spécifiques à chaque sol, labels qui sont ensuite retirés à la politique au déploiement : le robot développe des comportements de lever implicitement adaptés à chaque surface, sans qu'on lui indique sur quoi il repose. Les méthodes antérieures s'arrêtaient généralement au lever quasi-statique ou entraînaient une politique de compromis dégradée face à la diversité des terrains. PTDL enchaîne récupération et reprise de marche sous une seule politique proprioceptive unifiée, ce qui est directement pertinent pour tout déploiement en environnement industriel non structuré où la chute n'est pas une exception mais une probabilité réelle. Le G1 de Unitree Robotics (Shenzhen) est devenu en 2024-2025 une plateforme de référence pour la recherche en locomotion humanoïde, notamment grâce à son accessibilité tarifaire (environ 16 000 USD). La récupération après chute reste un angle mort notoire dans la course humanoïde actuelle : Figure AI (Figure 03), Boston Dynamics (Atlas), Agility Robotics (Digit) et Tesla (Optimus) se concentrent principalement sur les démonstrations de marche et de manipulation, peu sur les protocoles de résilience post-chute. Ce preprint arXiv n'annonce pas de déploiement industriel immédiat et n'a pas encore subi de révision par les pairs, mais il ouvre une piste méthodologique solide : entraîner sur des terrains stratifiés tout en maintenant une politique unifiée à l'inférence, une approche transposable à d'autres défis de robustesse en conditions réelles.

RecherchePaper
1 source
Coordination continue de robots quadrupèdes par découverte de compétences sémantiques
66arXiv cs.RO 

Coordination continue de robots quadrupèdes par découverte de compétences sémantiques

Des chercheurs ont publié sur arXiv (réf. 2606.08102) un framework appelé Conquer, conçu pour coordonner des équipes de robots quadrupèdes en apprentissage continu, c'est-à-dire sans avoir à réentraîner le système à chaque nouvelle tâche. L'approche repose sur une bibliothèque de compétences sémantiques organisée autour d'un cycle récupérer-adapter-mettre à jour : avant d'exécuter une tâche inconnue, le système construit un descripteur sémantique à partir des informations pré-exécution, retrouve la compétence la plus proche dans la bibliothèque, l'adapte, puis intègre les trajectoires réelles pour enrichir la base. Le backbone SAG (Self-Allies-Goal) permet de gérer des équipes de taille variable en modélisant explicitement l'état propre de chaque robot, le contexte de ses coéquipiers et l'objectif de la tâche. En simulation, Conquer atteint un taux de succès moyen final de 95,6 %, avec un transfert positif démontré vers de nouvelles tâches et un oubli catastrophique qualifié de négligeable. Des essais en conditions réelles ont été conduits sur des équipes de Unitree Go2, le quadrupède commercial d'Unitree Robotics. Ce résultat compte parce qu'il s'attaque à l'un des verrous fondamentaux de la robotique multi-agents : les méthodes de type MARL (apprentissage par renforcement multi-agents) existantes entraînent des politiques spécifiques à une famille de tâches fermée, ce qui les rend inutilisables dans des environnements industriels où les missions évoluent en permanence. Conquer propose une alternative où de nouvelles compétences de coordination s'accumulent sans effacer les précédentes, un prérequis pour tout déploiement réel dans des entrepôts ou sur des lignes de production à géométrie variable. La capacité à gérer des équipes de taille arbitraire est également non triviale : la plupart des approches supposent un nombre fixe d'agents. À noter cependant que les métriques de succès sont issues de simulation, et que les vidéos de déploiement sur Go2 restent des démonstrations sélectionnées, sans données quantifiées sur les taux d'échec terrain ni sur les temps de cycle réels. La coordination multi-quadrupèdes s'est intensifiée avec la disponibilité de robots comme le Go2 d'Unitree (lancé à moins de 2 700 dollars en version grand public), qui abaisse le coût d'expérimentation en laboratoire. La problématique de l'apprentissage continu en robotique est partagée par plusieurs groupes de recherche, notamment autour des architectures VLA (Vision-Language-Action) qui cherchent elles aussi à éviter la réinitialisation à chaque nouvelle tâche. Conquer se positionne dans un espace encore peu industrialisé, entre les approches MARL classiques et les frameworks généralistes de type foundation model. Les prochaines étapes logiques seraient des évaluations en entrepôt réel sur des tâches de manutention collaboratives, domaine où des acteurs comme Exotec (France) ou Boston Dynamics investissent sur des flottes mixtes humanoïdes et quadrupèdes.

RecherchePaper
1 source
Mind Your Steps : un cadre d'apprentissage général pour le suivi précis des appuis de pas chez les robots humanoïdes
67arXiv cs.RO 

Mind Your Steps : un cadre d'apprentissage général pour le suivi précis des appuis de pas chez les robots humanoïdes

Des chercheurs ont déposé le 9 juin 2026 sur arXiv (réf. 2606.08253) un framework léger pour entraîner des politiques de locomotion humanoïde capables de suivre précisément des appuis en 3D. Les approches dominantes basées sur l'apprentissage par renforcement avec commande de vitesse produisent des humanoïdes robustes, mais sans contrôle explicite du placement des pas : le robot peut marcher sur un pied humain ou rater un appui précis, compromettant les tâches de manipulation en aval. La méthode proposée introduit un "goal sampler" dynamique qui génère des séquences d'appuis variées pendant l'entraînement, rendant la politique agnostique au terrain. Une nouvelle représentation des cibles de pas compense les imprécisions du monde réel (estimation de pose bruitée, détection de contact peu fiable). La politique fonctionne comme un contrôleur bas niveau autonome, couplable à n'importe quel planificateur haut niveau, qu'il soit basé sur des cartes 2.5D, la vision ou un agent VLA. L'intérêt pour les intégrateurs industriels est concret : la précision du placement des appuis conditionne l'ensemble des tâches loco-manipulation, soit la prochaine étape critique avant le déploiement d'humanoïdes dans les entrepôts et lignes de montage. En découplant le contrôleur bas niveau du planificateur, cette architecture permet de substituer l'algorithme de planification sans réentraîner la locomotion, un argument de modularité fort pour des déploiements multi-environnements. Les expériences en simulation et en transfert sim-to-real sur terrains complexes sont présentées comme concluantes, mais ce preprint non encore évalué par les pairs ne fournit pas de benchmark comparatif public ni de métriques de précision standardisées. Ce framework s'inscrit dans la continuité des travaux sur la locomotion bipède précise issus d'ETH Zurich, du MIT et de CMU, que les équipes commerciales (Boston Dynamics Atlas, Agility Robotics Digit, Unitree H1, Figure AI) cherchent à industrialiser. L'abstract ne précise pas la plateforme matérielle utilisée lors des tests réels, ce qui limite la reproductibilité des résultats. La prochaine étape logique serait une évaluation ouverte sur des robots nommément identifiés, assortie de métriques comparables aux approches concurrentes en planification de pas développées à l'EPFL ou à Carnegie Mellon.

UEL'EPFL est citée comme référence concurrente pour la planification de pas, ce qui signale la compétitivité des labos européens dans ce domaine, mais sans impact direct sur des acteurs ou institutions français.

HumanoïdesPaper
1 source
QuadVerse : un cadre intégré alignant réalité visuelle et physique pour la simulation quadrupède
68arXiv cs.RO 

QuadVerse : un cadre intégré alignant réalité visuelle et physique pour la simulation quadrupède

Une équipe de recherche a publié début juin 2026 QuadVerse, un cadre de simulation intégré pour robots quadrupèdes conçu pour résoudre simultanément les décalages visuels, physiques et d'actionneur qui constituent le sim-to-real gap. La méthode repose sur une reconstruction de scènes par 3D Gaussian Splatting (3DGS) à partir de vidéos RGB ordinaires : ces scènes servent de substrat de calibration commun à toute la pipeline. Les maillages géométriques extraits permettent un rendu photoréaliste en vue ego, une détection de collisions, et une initialisation de priors de friction spatialement variables, affinés par une recherche bayésienne sur des trajectoires réelles. Un compensateur de dynamique résiduelle est ensuite entraîné en rejouant ces trajectoires sur le terrain calibré, séparant les erreurs de contact dues au relief des non-idéalités propres aux actionneurs. Les expériences rapportées montrent une amélioration de la qualité de reconstruction et du suivi de locomotion par rapport aux baselines, ainsi qu'un déploiement zero-shot d'une politique de navigation visuelle sans aucune collecte de données terrain spécifique à la tâche. Ce que QuadVerse apporte concrètement, c'est une approche unifiée du sim-to-real : là où la majorité des travaux traitent le gap visuel ou dynamique de façon indépendante, ce framework les calibre conjointement à partir du même substrat de scène reconstruite. L'accumulation et la propagation des erreurs individuelles dans l'évolution d'état du robot sont explicitement prises en compte, un problème souvent sous-estimé dans les pipelines existants. Le résultat le plus opérationnel est le déploiement zero-shot : une politique entraînée entièrement en simulation peut être transférée sur un robot réel sans rollout terrain supplémentaire, ce qui réduit le coût d'adaptation à de nouveaux environnements. Pour les intégrateurs qui cherchent à accélérer les cycles de validation, c'est un levier potentiellement significatif. Il faut néanmoins souligner que l'article est un preprint arXiv (v2 déposé en juin 2026), les expériences sont conduites en environnement contrôlé, et aucune validation industrielle à grande échelle n'est encore documentée. Le sim-to-real gap est l'un des problèmes centraux de la robotique apprenante depuis plusieurs années. Des équipes comme ETH Zurich (ANYmal), Agility Robotics ou Boston Dynamics ont montré que les politiques de locomotion peuvent franchir ce gap, mais souvent au prix d'une randomisation de domaine intensive ou d'une adaptation en conditions réelles coûteuse. La technique de 3D Gaussian Splatting, popularisée en 2023, est de plus en plus mobilisée dans des pipelines robotiques pour sa capacité à produire des représentations photoréalistes différentiables. QuadVerse s'inscrit dans un courant actif incluant des travaux comparables autour de NeRF-to-Real et les simulateurs hybrides de Nvidia Isaac Lab. La prochaine étape logique serait une validation sur des plateformes commerciales standardisées comme l'Unitree Go2 ou l'ANYmal-D en environnements non structurés, et une éventuelle extension aux politiques de manipulation pour robots à pattes équipés de bras.

RecherchePaper
1 source
Un robot humanoïde gravit un volcan de 6 200 m, l'équipe vise ensuite l'Everest
69Interesting Engineering 

Un robot humanoïde gravit un volcan de 6 200 m, l'équipe vise ensuite l'Everest

Un robot humanoïde Unitree G1 modifié, baptisé "Pemba", a atteint le sommet du Chimborazo en Équateur le 7 juin 2026, soit 6 200 mètres d'altitude. L'expédition, conduite par l'ingénieur Pablo Berlanga Boemare et son entreprise Geologic Dome, s'est déroulée sur 16 heures. Pemba est une première étape d'un programme baptisé "Triple Crown" qui vise à terme l'ascension de l'Everest. À noter : le robot n'a pas grimpé en autonomie totale. Il a marché de manière indépendante sur les sections présentant une inclinaison inférieure à 30 degrés, mais a été porté par les membres de l'expédition sur les passages plus techniques. Les modifications matérielles incluent des systèmes de gestion thermique sur mesure et des équipements de ventilation intégrés aux vêtements protecteurs du robot, s'appuyant sur des tests antérieurs conduits dans la région chinoise d'Altay à des températures descendant jusqu'à -47,4°C. Ce projet répond à une question que les benchmarks en laboratoire ne peuvent pas trancher : un humanoïde peut-il opérer de manière utile dans des environnements extrêmes, là où les capteurs fixes sont coûteux à déployer et où les conditions mettent en danger les opérateurs humains ? Berlanga Boemare, ancien collaborateur du WWF dans le bassin du Congo et en Amazonie, articule le cas d'usage autour de la surveillance environnementale mobile : remplacer ou compléter des réseaux de caméras stationnaires par des plateformes autonomes capables de patrouiller de grandes surfaces, équipées de caméras, capteurs et connectivité satellite (Starlink est mentionné). Pour les décideurs B2B et les intégrateurs industriels, l'intérêt est ailleurs : il s'agit d'un premier jeu de données réel sur la résilience des batteries, la cinématique articulaire et le comportement thermique de l'électronique embarquée au-delà de 6 000 mètres, dans des conditions que les simulations ne modélisent pas fidèlement. Unitree Robotics, fabricant chinois du G1, s'est imposé ces deux dernières années comme un acteur de référence sur le segment des humanoïdes accessibles, face à Boston Dynamics, Figure AI et Agility Robotics qui ciblent davantage le marché industriel avec des machines nettement plus coûteuses. Geologic Dome ne s'inscrit pas dans cette course à la productivité d'entrepôt, mais ouvre un segment distinct : la robotique d'exploration et de surveillance environnementale en terrain hostile. La prochaine étape annoncée est l'Everest, en partenariat avec l'opérateur népalais Fourteen Peaks Expedition, avec un programme de test prévu entre le camp de base et le Camp IV (environ 8 000 mètres), couvrant performance des batteries, stress articulaire et collecte de données environnementales. Le projet bute cependant sur un obstacle réglementaire concret : le Népal ne dispose pas encore de cadre légal encadrant les expéditions robotiques sur l'Everest, et les autorités auraient demandé de nouvelles régulations avant toute autorisation.

HumanoïdesPaper
1 source
Vidéo : des robots humanoïdes volent la vedette dans America's Got Talent
70Interesting Engineering 

Vidéo : des robots humanoïdes volent la vedette dans America's Got Talent

Huit robots humanoïdes G1 du fabricant chinois Unitree ont performé en direct sur NBC lors du premier épisode de la saison en cours d'America's Got Talent, diffusé mardi soir aux États-Unis. Aux côtés du danseur Wu Yufei, originaire du Sichuan et connu sous le pseudonyme "Flying Bug", les machines ont exécuté une chorégraphie synchronisée combinant mouvements rythmés et coordination précise avec l'interprète humain. Le numéro a reçu une ovation debout du public en studio et l'approbation unanime des quatre juges, propulsant le duo vers la prochaine étape d'une compétition dotée d'un grand prix d'un million de dollars. Yufei a présenté l'un des robots sous le surnom "Jackie", en référence au kung-fu. Le mode de pilotage des machines pendant la performance (téléopération partielle, séquences préenregistrées ou autonomie hybride) n'a pas été divulgué par l'équipe, un point que les commentateurs spécialisés n'ont pas manqué de relever. La prestation illustre un paradoxe croissant aux États-Unis: l'enthousiasme du grand public pour les humanoïdes chinois se heurte à une pression législative grandissante. Le lendemain même de la diffusion, une proposition de loi bipartisane, le Guard Act, a été déposée au Congrès pour interdire les robots d'origine chinoise jugés risques pour la sécurité nationale. En parallèle, l'American Security Robotics Act avance avec pour objectif d'empêcher les agences fédérales d'acquérir des robots produits par des entreprises chinoises, humanoïdes inclus. Pour les décideurs B2B et les intégrateurs industriels, cette double dynamique crée une incertitude réelle: adopter une technologie qui capte l'adhésion populaire tout en naviguant un risque réglementaire croissant. La visibilité télévisée d'Unitree renforce la crédibilité commerciale de ses machines auprès des acheteurs non spécialisés, un levier marketing qu'aucun salon professionnel ne peut reproduire à cette échelle. Fondée à Hangzhou, Unitree commercialise ses robots à l'international via la plateforme AliExpress d'Alibaba, ciblant les marchés d'Amérique du Nord, d'Europe et du Japon. La société a récemment annoncé un partenariat avec Nvidia pour concevoir un design de référence humanoïde baptisé H2+, dont la disponibilité est prévue pour la fin de l'année. Sur le terrain, les observateurs notent que le déploiement opérationnel des robots chinois à l'étranger se heurte à des obstacles concrets: identification des cas d'usage industriels, collecte de données opérationnelles, et construction de réseaux locaux de maintenance, d'intégration et de calibration. Face à Unitree, le marché des humanoïdes voit s'affronter Figure AI (Figure 02), Tesla (Optimus Gen 2), Boston Dynamics (Atlas électrique), Physical Intelligence (pi0) et Agility Robotics (Digit), tous positionnés sur des verticales industrielles précises. L'apparition télévisée ne règle aucun de ces défis opérationnels, mais marque une étape dans la bataille pour la normalisation culturelle des humanoïdes auprès du grand public américain.

UEUnitree ciblant explicitement les marchés européens via AliExpress, la pression réglementaire américaine sur les robots chinois (Guard Act, American Security Robotics Act) pourrait inspirer des mesures similaires en Europe sur l'acquisition de robotique d'origine chinoise par les entités publiques et industrielles.

Chine/AsieOpinion
1 source
Apprentissage de la représentation du contact pour l'odométrie des jambes
71arXiv cs.RO 

Apprentissage de la représentation du contact pour l'odométrie des jambes

Une équipe de chercheurs a publié sur arXiv (référence 2606.05501) une approche d'apprentissage de représentation auto-supervisée pour la détection de contact dans les robots à pattes, visant à améliorer l'odométrie locomotrice sans recourir à des capteurs de force aux extrémités. Le système repose exclusivement sur les encodeurs articulaires standard, présents sur la quasi-totalité des plateformes commerciales existantes. En modélisant les phases d'appui et de vol (stance et swing) de façon probabiliste, le framework permet d'estimer la vitesse du corps principal à partir de la chaîne cinématique des membres, en s'appuyant sur l'hypothèse classique que la vitesse du pied par rapport au monde est nulle en phase d'appui. Les résultats expérimentaux indiquent des performances supérieures aux méthodes supervisées nécessitant des capteurs additionnels et aux approches probabilistes de référence. Le code est publié en open source. L'enjeu est concret : l'odométrie par jambes est une brique fondamentale pour la navigation autonome des robots quadrupèdes et bipèdes, notamment lorsque le GNSS ou la vision sont dégradés. Or, les capteurs de réaction au sol (GRF sensors) alourdissent les pieds, augmentent la complexité mécanique et sont souvent aveugles aux glissements en contact, ce qui produit des dérives d'estimation même lorsque le pied est techniquement "posé". En éliminant cette dépendance sensorielle, cette approche ouvre la voie à un déploiement sur des plateformes à budget contraint, et surtout améliore la robustesse sur surfaces glissantes ou irrégulières, scénario typique des environnements industriels ou d'inspection. La nature auto-supervisée supprime également le coût d'annotation de données, un frein classique dans les pipelines de locomotion. Le problème de la détection fiable de la phase d'appui est étudié depuis l'essor des robots quadrupèdes comme ANYmal (ANYbotics) et Go1/Go2 (Unitree), ainsi que des bipèdes comme Spot (Boston Dynamics) ou Atlas. La majorité des stacks d'odométrie actuels, y compris ceux utilisés dans des frameworks open source comme Legged Gym ou OCS2, conservent une dépendance aux GRF sensors ou à des heuristiques de seuillage. Cette contribution s'inscrit dans une tendance plus large visant à rendre la locomotion avancée accessible sur des plateformes sans instrumentation de pointe, une direction également explorée par des labos européens comme le DLR ou l'INRIA. La prochaine étape naturelle sera la validation sur plusieurs morphologies de robots et dans des conditions de terrain dégradé, un benchmark que les auteurs n'ont pas encore publié.

UEL'approche intéresse directement des équipes comme l'INRIA qui travaillent sur la locomotion avancée, et pourrait être intégrée sans modification matérielle sur des plateformes européennes à budget contraint.

RecherchePaper
1 source
IA incarnée sûre pour les tâches à long horizon : une analyse multi-couches de la manipulation robotique
72arXiv cs.RO 

IA incarnée sûre pour les tâches à long horizon : une analyse multi-couches de la manipulation robotique

Une équipe de chercheurs publie sur arXiv (identifiant 2606.05660, juin 2026) une revue systématique de la sécurité dans les systèmes d'IA incarnée (embodied AI) appliqués à la manipulation robotique à long horizon. Ce survey structure la littérature selon trois niveaux d'intervention : la sécurité au stade de la planification (planning-time), au niveau de la politique de contrôle (policy-time) et pendant l'exécution (execution-time). Les auteurs identifient quatre vecteurs de risque pouvant s'accumuler dans un même système en boucle fermée : le misgrounding sémantique (l'agent interprète mal l'instruction de haut niveau), la propagation d'erreur entre sous-tâches, la dérive d'exécution (execution drift) et les risques physiques liés aux contacts. Ils distinguent par ailleurs trois catégories de garanties dans la littérature existante : formelles, statistiques et heuristiques empiriques, et concluent que les preuves formelles font défaut à chaque couche. L'enjeu est direct pour les intégrateurs et les décideurs industriels. Un bras robotique déployé en entrepôt ou en ligne de production enchaîne des dizaines d'actions sur des horizons temporels étendus, et chaque sous-tâche peut propager silencieusement une erreur vers les suivantes. Or le survey révèle que la sécurité au niveau de la politique de contrôle, au coeur même des modèles VLA (Vision-Language-Action) comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, est la couche la moins documentée empiriquement. Les mécanismes d'intervention déclenchés par l'incertitude (uncertainty-triggered intervention) restent immatures, et les benchmarks spécifiques à la sécurité en manipulation longue durée sont quasi-inexistants, ce qui rend toute validation rigoureuse avant déploiement aujourd'hui difficile. Ce travail paraît dans un contexte d'accélération industrielle : Figure AI, Boston Dynamics, Unitree et Physical Intelligence multiplient les démonstrations de manipulation dextère, souvent en conditions semi-contrôlées, alimentant un écart potentiel entre annonces marketing et réalité opérationnelle. Il convient de souligner que ce papier est une analyse critique de l'existant, pas un nouveau système ou algorithme. Ses recommandations prioritaires portent sur trois axes : des assurances cross-couche cohérentes de la planification jusqu'à l'exécution physique, des benchmarks dédiés à la sécurité en manipulation longue durée, et des protocoles de déploiement progressifs pour les agents robotiques en environnements réels. En creux, le constat est que les capacités du secteur progressent plus vite que les outils pour en évaluer la sécurité.

UEL'absence de benchmarks formels de sécurité pour la manipulation longue durée concerne directement les industriels européens déployant des bras robotisés, et pourrait alimenter les exigences de validation dans le cadre de l'AI Act pour les systèmes robotiques à haut risque.

RecherchePaper
1 source
HERO : saisie visuelle d'objets à vocabulaire ouvert par contrôle corps entier d'un humanoïde
73arXiv cs.RO 

HERO : saisie visuelle d'objets à vocabulaire ouvert par contrôle corps entier d'un humanoïde

Des chercheurs ont publié sur arXiv (référence 2602.16705, version 3) un système de manipulation locomotrice pour humanoïdes baptisé HERO (Humanoid End-Effector Residual cOntrol), conçu pour saisir des objets du quotidien sans liste prédéfinie de cibles. Le système fonctionne en open-vocabulary : il identifie visuellement les objets via des images RGB-D et des grands modèles de vision, puis planifie et exécute la saisie en temps réel. L'innovation centrale est une politique de suivi de l'effecteur terminal (EE) dite "résidual-aware", qui combine trois composants : une cinématique inverse pour convertir les cibles résiduelles de l'EE en trajectoires de référence, un modèle neuronal de cinématique directe entraîné en simulation, et un mécanisme de ré-planification dynamique. Ce pipeline réduit l'erreur de suivi de l'effecteur à 2,44 cm, soit une amélioration annoncée de 5,5x par rapport à la meilleure méthode antérieure. Les tests en environnements réels, bureaux, cafés, démontrent la saisie de mugs, pommes et jouets sur des surfaces allant de 43 à 92 cm de hauteur. L'approche modulaire de HERO rompt avec la tendance dominante des méthodes end-to-end monolithiques (apprentissage par imitation, sim-to-real intégral) qui peinent à généraliser sans retraining massif. En séparant la compréhension de scène, déléguée aux fondations vision, du contrôle moteur précis, entraîné entièrement en simulation, les auteurs obtiennent une généralisation out-of-distribution plus robuste sur de nouveaux environnements. Pour un intégrateur, cela signifie potentiellement moins de données de démonstration à collecter par site de déploiement. Les 2,44 cm d'erreur restent trop élevés pour des tâches d'assemblage de précision, mais suffisants pour le pick-and-place d'objets courants. La métrique "5,5x meilleure" mérite réserve : les conditions exactes du benchmark ne sont pas détaillées dans l'abstract. Ce travail s'inscrit dans une course dense sur le contrôle loco-manipulation des humanoïdes. Physical Intelligence avec Pi-0, Figure AI avec Figure 03, Agility Robotics avec Digit, et Unitree explorent tous des pipelines combinant grands modèles de vision-langage-action (VLA) et contrôle fin de l'effecteur. La question du sim-to-real gap reste le principal verrou non résolu dans le secteur pour les tâches de manipulation dextre, et HERO propose une réponse architecturale partielle en hybridant cinématique classique et apprentissage neuronal, une direction explorée également par des équipes européennes comme Wandercraft sur leurs plateformes bipèdes. Aucun partenariat industriel ni timeline de déploiement n'est mentionné : il s'agit pour l'instant d'un résultat de recherche, pas d'un produit commercialisé.

UEDes équipes européennes comme Wandercraft explorent des architectures similaires sur le contrôle bipède ; l'approche hybride de HERO (cinématique classique + apprentissage neuronal) peut informer leurs pipelines de R&D, mais l'impact reste indirect, sans déploiement ni partenariat industriel européen associé.

IA physiquePaper
1 source
Transfert de style de mouvement humain pour le contrôle physique de robots humanoïdes
74arXiv cs.RO 

Transfert de style de mouvement humain pour le contrôle physique de robots humanoïdes

Un groupe de chercheurs présente dans un preprint arXiv (2606.03536, soumis le 3 juin 2026) un framework de transfert de style de mouvement pour robots humanoïdes. Le système prend en entrée un court clip humain illustrant un style moteur désiré (rythme de marche, balancement des bras, posture) et un mouvement cible distinct, puis génère un mouvement corps entier stylisé adapté au robot. Le modèle central est un modèle de diffusion latente multi-condition, sensible à la physique, fusionnant conditions de style, de contenu et de trajectoire. La guidance classifier-free permet d'ajuster l'intensité du style sans réentraîner le modèle. Les références générées sont ensuite converties pour le robot Unitree G1 et exécutées par une politique de suivi corps entier entraînée via une stratégie "cluster-and-distill". Sur 125 essais sur robot réel, la méthode atteint un taux de réussite de 96,0 %, avec moins d'artefacts de contact et de jitter que les baselines orientées animation. Ce résultat remet en question le paradigme dominant où chaque comportement expressif d'un humanoïde est soit capturé en démonstration directe, soit scripté manuellement, deux approches coûteuses et non réutilisables entre contenus de mouvement différents. En permettant à un court clip humain de servir de source de style transférable sur des contenus arbitraires, le framework ouvre la voie à une personnalisation motrice procédurale. L'écart simulation-hardware est adressé directement par des régularisations de cohérence de contact et de lissage temporel imposées lors de l'entraînement, un point de friction récurrent dans la chaîne génération-contrôle. Un taux de 96 % sur 125 essais réels représente un résultat solide pour de la recherche académique dans ce domaine, où beaucoup de travaux restent confinés à la simulation. Le Unitree G1 (environ 16 000 dollars) s'est imposé ces 18 derniers mois comme la plateforme de référence pour la recherche humanoïde académique. Ces travaux s'inscrivent dans la tendance des modèles de diffusion appliqués à la génération de mouvement (MDM, MotionDiffuse), prolongée ici jusqu'au contrôle physique sur hardware réel. Dans la course à l'expression motrice des humanoïdes, Boston Dynamics (Atlas), Figure et 1X investissent massivement côté imitation learning et VLA end-to-end, tandis que ce preprint se positionne sur la génération procédurale contrôlée, approche complémentaire. Du côté européen, Wandercraft et Enchanted Tools (France, robot Mirokaï) travaillent sur des problématiques d'expression motrice proches, sur des architectures distinctes. La suite logique serait l'intégration de ce framework dans des pipelines de téléopération ou d'interfaces humain-robot en conditions industrielles réelles.

UEWandercraft et Enchanted Tools (France) travaillent sur des problématiques d'expression motrice similaires et pourraient s'inspirer de cette approche de transfert de style procédural sur hardware réel.

HumanoïdesPaper
1 source
Mémoire épisodique pour robots à filtrage par surprise
75arXiv cs.RO 

Mémoire épisodique pour robots à filtrage par surprise

Des chercheurs ont publié sur arXiv (référence 2606.03787) une architecture de mémoire épisodique sélective pour robots généralistes, baptisée "Surprise-Gated Episodic Memory". Le principe central : utiliser la surprise bayésienne comme filtre pour décider quels événements méritent d'être mémorisés à long terme. Plutôt que de stocker l'intégralité du flux sensoriel, un mécanisme de calcul de surprise opère dans l'espace latent de V-JEPA-2, le modèle vidéo de Meta, jugé sémantiquement riche et indépendant du contexte de déploiement. Cette mémoire épisodique filtrée vient augmenter une mémoire spatiale fondée sur des graphes de scène 4D. Sur les benchmarks de question-answering robot, l'approche surpasse les méthodes de référence d'au moins 12 % sur les questions temporelles, spatiales et binaires, et bat également des méthodes supervisées ainsi que des approches non-causales, avec une méthode non supervisée et causale pour la segmentation d'événements. L'enjeu derrière ce résultat est directement opérationnel : un robot généraliste déployé en entrepôt, en hôpital ou sur un chantier reçoit des instructions ancrées dans des événements passés ("Retourne là où le colis a été mal placé hier soir"). Sans mémoire épisodique sélective, soit le robot stocke tout et sature sa mémoire, soit il oublie et échoue à répondre. La surprise bayésienne comme critère de filtrage est élégante parce qu'elle ne nécessite aucun superviseur humain ni liste de tâches futures a priori, elle capte l'inhabituel de façon autonome. Que cette méthode non supervisée et causale batte des méthodes supervisées est un signal fort : le sim-to-real gap pour la mémoire sémantique pourrait se réduire sans annotation coûteuse. Ce travail s'inscrit dans un courant de recherche en pleine accélération autour de la mémoire à long terme pour les robots mobiles, face aux limites des approches purement réactives popularisées par les VLA (Vision-Language-Action models). V-JEPA-2, publié par Meta en 2025, s'impose progressivement comme fondation visuelle pour plusieurs équipes de recherche extérieures à Meta. Sur le plan concurrentiel, des approches comparables sont développées par des groupes travaillant sur les représentations spatiales pour l'embodied AI (CMU, Stanford, ETH Zurich). L'étape suivante naturelle serait de valider la méthode sur du matériel réel en conditions non contrôlées, les résultats actuels restant des benchmarks, la question du passage à l'échelle sur des robots comme Figure 03 ou Unitree G1 en déploiement continu reste entière.

RecherchePaper
1 source
Stardust Intelligence lève plus d'un milliard de yuans en série B, sa valorisation dépasse 10 milliards
7636Kr 

Stardust Intelligence lève plus d'un milliard de yuans en série B, sa valorisation dépasse 10 milliards

Astribot (星尘智能), startup shenzhenoise spécialisée dans les humanoïdes à transmission par câble, a bouclé une série B représentant plus d'un milliard de yuans (environ 125 millions d'euros) en trois tours sur trois mois. Sa valorisation dépasse désormais 10 milliards de yuans, la hissant au rang de licorne shenzhenoise de l'embodied intelligence. Le tour réunit des fonds régionaux (Liangxi Tech Innovation Fund géré par Bohua Capital, Yangzhou Longtou Xinli), l'industriel ThinkTech (中科创达), GUOKE Investment, et confirme le réinvestissement d'actionnaires historiques liés à Tencent, Alibaba et ByteDance. Sur le plan commercial, Astribot signe une commande de l'ordre du millier d'unités avec ThinkTech pour des applications industrielles et de services, avec expansion à l'export, ainsi que la co-construction d'un centre d'application de 100 millions de yuans avec la zone de développement économique de Jiangdu pour l'hôtellerie et le tourisme culturel. La gamme T1, lancée à 89 900 yuans (environ 11 500 euros), exécute des tâches en séquence continue : cuisson, service en bar, tri de pièces automobiles, manipulation chimique. Des livraisons à l'échelle du millier d'unités ont démarré fin 2025. Ce qui distingue Astribot sur le plan technique, c'est son choix de la transmission tendineuse par câble (rope-driven), imitant la biomécanique musculaire humaine : moteurs déportés, câbles tractant les articulations, avec un couplage rigide-souple qui préserve la rigidité opérationnelle tout en absorbant les chocs. L'entreprise revendique être la première au monde à avoir industrialisé cette approche en production de masse pour des humanoïdes IA. Pour les intégrateurs, cela signifie un meilleur rapport charge utile/masse, moins de backlash mécanique, et des données de force proprioceptives de haute qualité transmises fidèlement au modèle, un avantage critique pour l'apprentissage de la physique réelle. L'intelligence embarquée repose sur DuoCore, une architecture bicéphale rapide/lente inspirée du double système cognitif humain, structurellement convergente avec l'architecture Helix de Figure dévoilée quasi simultanément, ce qui constitue une validation indépendante de cette direction. Le système rapide gère la compliance articulaire et l'évitement d'obstacles en temps réel ; le système lent planifie les tâches longues et coordonne les deux bras. Le modèle de fondation VLA maison, Lumo, entraîné par pré-entraînement puis alignement sur robot physique, affiche une généralisation à des objets inconnus et des environnements non vus. DuoCore est déjà déployé en conditions réelles dans la distribution au détail dans six villes chinoises, ce qui constitue un déploiement opérationnel, pas une démonstration en laboratoire. Astribot a été fondée en 2022 par Lai Jie, qui cumule 17 ans d'expérience en IA et robotique : il a été le premier employé et architecte du laboratoire de robotique de Tencent, puis directeur de l'équipe robot Xiaodu chez Baidu. Sa philosophie "Design for AI" consiste à concevoir d'abord un corps adapté à l'apprentissage par un grand modèle, puis à y adjoindre l'algorithme, structurant ainsi toute l'architecture produit. L'entreprise s'inscrit dans un secteur très concurrentiel face à Unitree (G1, H1), Figure (02, Helix), Boston Dynamics (Atlas électrique), Agility Robotics (Digit), et côté chinois, Fourier Intelligence et Galbot. Sa différenciation repose sur la transmission câblée et une stratégie de données axée sur l'efficacité plutôt que le volume brut. Les prochaines étapes annoncées incluent l'internationalisation des commandes ThinkTech et l'intégration de capacités de modèle du monde (world model) dans les futures versions de Lumo.

UELa montée en puissance d'Astribot renforce la pression concurrentielle sur les acteurs européens de l'humanoïde (Wandercraft, Enchanted Tools) ; l'internationalisation annoncée des commandes ThinkTech pourrait atteindre l'Europe, mais aucun déploiement ou partenariat européen n'est confirmé à ce stade.

Chine/AsieOpinion
1 source
Suivi corporel intégral contraint pour robots humanoïdes
77arXiv cs.RO 

Suivi corporel intégral contraint pour robots humanoïdes

Des chercheurs ont publié sur arXiv (2606.00374) un framework de contrôle baptisé ConstrainedMimic, conçu pour imposer des contraintes de sécurité en temps réel sur des robots humanoïdes pilotés par apprentissage par renforcement. La démonstration s'appuie sur un Unitree G1 simulé : le système fait tourner la politique de suivi de mouvement whole-body à 300-500 Hz, indifféremment sur CPU, GPU ou TPU, tout en garantissant simultanément l'évitement de collisions (auto-collisions et obstacles externes), le respect des butées articulaires et la stabilité du centre de masse. Les expériences couvrent le suivi de mouvements cinématiques référencés et la téléopération. Le code sera libéré à la publication. L'enjeu sous-jacent est structurant pour l'industrialisation des humanoïdes : les politiques RL apprennent des comportements agiles mais ne savent pas, par défaut, respecter des contraintes ajoutées après entraînement, ce qui bloque le déploiement dans des environnements où les exigences de sécurité évoluent (cellule de travail reconfigurée, proximité opérateur, certification CE). ConstrainedMimic répond à ce problème en combinant deux outils de contrôle classiques, le contrôle en espace opérationnel (OSC) et les control barrier functions (CBF), pour projeter la commande du réseau de neurones dans un espace faisable respectant les contraintes actives. La méthode est entièrement différentiable et n'altère la politique que le strict minimum lorsqu'une contrainte entre en jeu, ce qui la distingue des approches d'override brutales. C'est un pas vers la séparation propre entre performance et sécurité dans les pipelines RL pour humanoïdes. Le sujet s'inscrit dans une course active à la robustesse des politiques whole-body : Figure (Figure 02/03), Boston Dynamics (Atlas), Agility Robotics (Digit) et Unitree investissent massivement en RL locomotion, mais la question des garanties formelles reste un angle mort industriel. Les CBF sont bien établies en robotique mobile (AMR, véhicules autonomes) mais leur intégration dans des politiques RL pour humanoïdes à haute dimension cinématique est encore exploratoire. À noter : l'évaluation reste entièrement en simulation, ce qui laisse ouverte la question du sim-to-real gap sur les contraintes dynamiques, un point que les auteurs n'adressent pas dans cet abstract. La publication du code facilitera la reproductibilité et pourrait accélérer l'adoption dans des labos comme le DLR, l'INRIA ou des intégrateurs industriels européens travaillant sur la certification de robots collaboratifs.

UELa publication du code pourrait permettre à des laboratoires européens comme l'INRIA ou le DLR d'intégrer des garanties formelles de sécurité dans leurs pipelines RL pour humanoïdes, facilitant la certification CE de robots collaboratifs en environnement industriel partagé.

HumanoïdesPaper
1 source
LEGS : affinage de VLA sans téléopération pour la loco-manipulation humanoïde dans un monde Gaussian Splatting incarné
78arXiv cs.RO 

LEGS : affinage de VLA sans téléopération pour la loco-manipulation humanoïde dans un monde Gaussian Splatting incarné

Des chercheurs présentent LEGS (Loco-manipulation via Embodied Gaussian Splatting), un simulateur hybride qui combine un avant-plan en maillage 3D avec un arrière-plan photoréaliste en Gaussian Splatting 3D (3DGS) pour entraîner des politiques vision-langage-action (VLA) sur humanoïdes sans téleopération humaine. Un générateur procédural de primitives de mouvement produit automatiquement des démonstrations annotées à grande échelle, tandis qu'une calibration colorimétrique à deux étapes aligne le rendu simulé avec la caméra réelle du robot. Sur un Unitree G1, sur trois tâches de saisie-dépose de difficulté croissante et avec trois architectures VLA (ψ₀, π₀.5 et GR00T N1.6), une politique entraînée exclusivement sur données LEGS égale ou dépasse, selon les auteurs, une politique entraînée sur démonstrations téleopérées. La couverture d'une nouvelle scène coûterait plus de quinze fois moins qu'une collecte par téleopération, une affirmation à vérifier hors du cadre expérimental : les résultats restent au stade de préprint arXiv (2606.01458) non soumis à revue par les pairs. Le résultat le plus structurant est la réduction effective du fossé simulation-réalité pour la loco-manipulation humanoïde corps entier, un problème que les simulateurs à maillage seul n'avaient pas résolu jusqu'ici. L'ablation le confirme : supprimer le fond 3DGS au profit d'un environnement mesh-only dégrade significativement les transferts, établissant le rendu photoréaliste comme facteur déterminant et non accessoire. Sous variations combinées d'apparence d'objet et de scène (scénario LEGS-AUG), la politique LEGS maintient son taux de succès tandis que la politique téleopérée échoue entièrement, ce qui valide empiriquement que les VLA nécessitent une diversité visuelle synthétique pour généraliser. Pour les intégrateurs et équipes robotiques, cela ouvre une voie scalable vers de nouveaux environnements industriels sans mobiliser d'opérateurs dédiés. LEGS s'appuie sur la technique 3DGS, popularisée en 2023 pour la reconstruction photoréaliste de scènes à partir d'images, et l'adapte en fond simulé pour l'entraînement de politiques. Les architectures testées incluent π₀.5 de Physical Intelligence et GR00T N1.6 de NVIDIA, deux acteurs centraux de l'espace VLA humanoïde, aux côtés desquels Boston Dynamics, Figure AI, Agility Robotics et Tesla Optimus avancent sur leurs propres pipelines de données synthétiques. Le Unitree G1, l'un des humanoïdes commerciaux les plus accessibles du marché, ancre les expériences dans un contexte potentiellement déployable. Les suites logiques incluent l'extension au-delà du pick-and-place, la publication du code et des données, et des tests en environnements industriels réels pour valider la robustesse hors laboratoire.

UELes équipes européennes en robotique humanoïde (CEA-List, INRIA, startups FR) pourraient adopter cette approche pour réduire drastiquement les coûts de collecte de données VLA sans téleopération, mais aucun acteur européen n'est impliqué dans l'étude.

IA physiqueOpinion
1 source
7 robots inspirés du vivant qui relèvent de vrais défis d'ingénierie
79Interesting Engineering 

7 robots inspirés du vivant qui relèvent de vrais défis d'ingénierie

Six familles de robots à morphologie animale concentrent une part croissante des efforts en robotique appliquée, couvrant des secteurs aussi divers que l'inspection industrielle, le sauvetage en catastrophe, la maintenance offshore et l'aquaculture. Le quadrupède Spot, commercialisé par Boston Dynamics, est déjà opérationnel dans des centrales électriques, des installations pétrolières et des chantiers pour des missions de surveillance en environnement dangereux. Les robots serpents, dotés de corps segmentés articulés, ont été testés par des équipes de recherche et des équipes de secours pour localiser des survivants dans des décombres post-séisme, là où les plateformes conventionnelles ne peuvent pas pénétrer. Des robots grimpeurs reproduisent les micro-structures adhésives des pattes de gecko pour inspecter verticalement ponts et infrastructures. En milieu offshore, le robot Eelume, développé par la spin-off NTNU éponyme soutenue par Equinor et Kongsberg, adopte la locomotion ondulatoire de l'anguille pour inspecter pipelines et plateformes en restant déployé durablement sous l'eau. Des chercheurs du CIRTESU (Centre de recherche en robotique et technologies sous-marines) de l'Universitat Jaume I ont récemment testé à PortCastelló un poisson-robot biomimétique à propulsion par nageoires, sans hélices, équipé de sonar et de systèmes de vision, pour surveiller les filets de fermes aquacoles. Le laboratoire CREATE de l'EPFL a par ailleurs présenté un bras souple reposant sur une structure d'hélicoïde tronqué (trimmed helicoid), inspirée de la trompe d'éléphant et des tentacules de pieuvre, qui module rigidité et flexibilité localement pour permettre une manipulation délicate en contexte co-robotique. Ces plateformes répondent à des problèmes industriels documentés, pas à des curiosités de laboratoire. Eelume modifie structurellement l'économie de la maintenance offshore : là où un ROV traditionnel nécessite un navire de surface et dépend de la météo, un système résident opère en continu, réduisant les coûts d'intervention. La propulsion par nageoires du robot valencien surpasse les hélices en discrétion et efficacité énergétique dans les milieux aquacoles. Spot constitue le cas commercial le plus avancé de la tendance, Boston Dynamics ayant livré plusieurs centaines d'unités à des industriels. Pour les autres familles, notamment les robots serpents, les tests restent majoritairement conduits en environnements contrôlés : le fossé sim-to-real pour des décombres réels n'est pas résolu. L'approche soft robotics de l'EPFL illustre une stratégie alternative : intégrer la compliance mécanique dans la conception plutôt que de la gérer par contrôle actif, ce qui simplifie considérablement l'implémentation en environnement co-robotique. Boston Dynamics développe Spot depuis les travaux fondateurs de Marc Raibert au MIT ; l'entreprise a été rachetée par Hyundai en 2021 pour 1,1 milliard de dollars. Sur le segment quadrupède, la concurrence est vive : ANYbotics (ANYmal), Unitree (Go2, H1) et Ghost Robotics (Vision 60) ciblent les mêmes marchés industriels avec des positionnements prix différenciés. Eelume opère sur le marché oil & gas depuis plusieurs années avec le soutien de majors du secteur. En Europe, Pollen Robotics et Enchanted Tools développent des architectures à inspiration biologique, mais restent peu positionnés sur ces créneaux applicatifs précis. L'aquaculture robotisée bénéficie de financements croissants dans le cadre du Blue Deal européen, ce qui devrait accélérer les déploiements à l'image du projet de l'Universitat Jaume I. L'intégration de modèles VLA (vision-language-action) pour la compréhension contextuelle des tâches et la certification ATEX pour les robots industriels constituent les prochains jalons pour plusieurs de ces familles.

UEPlusieurs acteurs européens figurent parmi les leaders des niches couvertes, Eelume/NTNU (soutenu par Equinor et Kongsberg) sur la maintenance offshore résidente, l'EPFL sur la soft robotics co-robotique, l'Universitat Jaume I sur l'aquaculture, et le financement croissant via le Blue Deal européen devrait accélérer les déploiements dans ce secteur, créant des opportunités pour les startups françaises Pollen Robotics et Enchanted Tools si elles se positionnent sur ces créneaux applicatifs.

IndustrielActu
1 source
Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes
80arXiv cs.RO 

Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes

Une équipe de chercheurs a publié sur arXiv (référence 2605.31343, mai 2026) un framework baptisé TA-WBC (Terrain-Aware Whole-Body Control) destiné aux manipulateurs à pattes, c'est-à-dire des robots combinant membres locomoteurs (quadrupèdes ou bipèdes) et bras articulés. Le coeur du système est une politique unifiée entraînée par apprentissage par renforcement (RL) qui pilote simultanément les jambes et le bras lors de tâches de loco-manipulation, terme désignant la capacité à se déplacer et manipuler des objets en même temps. L'architecture repose sur trois briques techniques : un encodeur d'extéroception hybride qui extrait en temps réel les caractéristiques du terrain, une méthode d'échantillonnage de l'effecteur final ancrée sur le plan de contact des pieds pour découpler la cible de manipulation des oscillations du torse, et un module de distillation à double politique pour intégrer motricité étendue et adaptabilité sans effacement catastrophique des compétences acquises. Les expériences en simulation et en environnement réel montrent une zone atteignable agrandie, une erreur de tracking réduite et moins de trébuchements imprévus. Ce travail s'attaque à une limitation structurelle des contrôleurs corps entier existants : leur dépendance quasi exclusive à la proprioception (capteurs internes, IMU, encodeurs) au détriment de l'extéroception (perception externe du terrain). En milieux industriels complexes comme les chantiers, les entrepôts en hauteur variable ou les sites nucléaires, cette lacune rend les plateformes mobiles-manipulatrices peu fiables dès que le sol n'est plus plan. Le découplage effecteur/torse est particulièrement notable pour les intégrateurs : il signifie que le bras peut maintenir une trajectoire stable même quand le corps compense une marche irrégulière, ce qui est un prérequis non négociable pour tout assemblage ou saisie de précision en terrain dégradé. La validation sim-to-real, même partielle, renforce la crédibilité d'une approche qui reste à ce stade un preprint non commercialisé. Les manipulateurs à pattes constituent une catégorie en pleine structuration. Boston Dynamics commercialise Spot avec bras depuis 2021, Unitree propose le B2W équipé d'un bras, et plusieurs laboratoires académiques majeurs (ETH Zurich, CMU, Berkeley) publient régulièrement sur la loco-manipulation. Le verrou que TA-WBC cherche à lever, la perception de topologie de terrain couplée au contrôle corps entier, est précisément ce qui freine le déploiement de ces plateformes au-delà des environnements structurés. Ce preprint n'annonce pas de produit ni de partenaire industriel ; il pose néanmoins une brique algorithmique que des acteurs comme Agility Robotics, Apptronik ou les équipes robotique de Google DeepMind pourraient intégrer dans leurs chaînes d'entraînement.

UETravail de recherche applicable aux déploiements industriels en environnements dégradés (sites nucléaires, entrepôts à topologie variable) présents en Europe, mais sans implication directe d'acteurs français ou européens.

RecherchePaper
1 source
ORBBEC s'étend au-delà de la vision robotique vers l'IA physique et l'impression 3D
81Pandaily 

ORBBEC s'étend au-delà de la vision robotique vers l'IA physique et l'impression 3D

ORBBEC (688322.SH), fabricant chinois de capteurs de vision 3D, annonce un élargissement stratégique vers quatre segments: Physical AI, vision IA généraliste, impression 3D et acquisition de données volumétriques. La société revendique plus de 70% de part de marché en Chine et en Corée du Sud sur le créneau vision robotique de service, s'appuyant sur une décennie de R&D qui lui a permis de taper une douzaine de puces propriétaires couvrant lumière structurée, iToF (temps de vol indirect), dToF et LiDAR. Ces capteurs sont d'ores et déjà intégrés dans les chaînes d'approvisionnement des fabricants d'humanoïdes AgiBot, UBTech et Unitree. Le 29 mai 2026, ORBBEC a élargi son partenariat avec Creality 3D, récemment introduite en bourse à Hong Kong, pour co-créer un centre d'innovation en scanners 3D et lancer une plateforme commune baptisée "3D Printing AI Vision Intelligent Platform". Financièrement, le premier trimestre 2026 affiche 203 millions de RMB de chiffre d'affaires, avec un bénéfice net retraité en hausse de 531% sur un an -- chiffre spectaculaire qui s'explique probablement par un faible niveau de base et qui reste à confirmer dans la durée. La portée industrielle de ce repositionnement tient à trois leviers combinés. En Physical AI, les capteurs ORBBEC alimentent les world models de simulation via une intégration confirmée dans NVIDIA Isaac Sim, ce qui positionne la société comme fournisseur de données réelles pour le cycle sim-to-real -- un noeud critique que peu d'acteurs hardware maîtrisent de bout en bout. Sur l'impression 3D, le contexte est porteur: les exports chinois du secteur ont progressé de 119% en glissement annuel sur les quatre premiers mois de 2026, rendant le partenariat Creality stratégiquement opportuniste. Enfin, la transition de "fournisseur de composants" vers "perception-as-a-service" signifie une montée vers les couches logicielles (reconnaissance, décision), ce qui modifie structurellement le profil de marges -- les analystes anticipent une amélioration du mix produit et une expansion des marges brutes tout au long de 2026. ORBBEC prend pied dans un marché longtemps dominé par des acteurs occidentaux aujourd'hui en retrait: Intel a arrêté sa gamme RealSense en 2023, Microsoft a mis fin à l'Azure Kinect la même année, laissant un vide que Stereolabs (ZED Camera), Photoneo ou Zivid cherchent à combler sur le segment industriel haut de gamme. ORBBEC se présente comme une alternative chinoise à coût compétitif, avec un ancrage fort sur le marché asiatique des robots de service et une ambition d'intégration verticale puce-algorithme-optique. Les prochaines étapes déclarées incluent le déploiement effectif du centre d'innovation commun avec Creality et le lancement commercial de la plateforme impression 3D. Les projections sectorielles évoquent un marché combiné scan-impression-modélisation 3D approchant les mille milliards de dollars sur la décennie -- une estimation à prendre avec précaution, mais qui illustre l'amplitude de la thèse de croissance que la société cherche à incarner.

UELe repositionnement d'ORBBEC intensifie la pression concurrentielle sur Stereolabs (France/ZED Camera) et Photoneo dans le segment capteurs 3D pour robotique industrielle, alors qu'Intel et Microsoft ont abandonné ce marché en 2023.

Chine/AsieOpinion
1 source
La Chine déploie des robots humanoïdes capables de trier 1 200 colis par heure dans un grand centre postal
82Interesting Engineering 

La Chine déploie des robots humanoïdes capables de trier 1 200 colis par heure dans un grand centre postal

La Chine a déployé des robots humanoïdes dans le centre logistique de Jianggao, rattaché au hub postal de Guangzhou (province du Guangdong), pour trier les colis à une cadence annoncée de 1 200 unités par heure. Des images diffusées cette semaine par l'agence Xinhua montrent ces systèmes humanoïdes travaillant en parallèle avec des bras robotiques et des chariots élévateurs autonomes dans un entrepôt fortement automatisé opéré par China Post Group. Le site traite en moyenne 6,5 millions de pièces de courrier par jour, avec des pics dépassant 10 millions. Les robots filmés saisissent des colis depuis des conteneurs et les déposent sur des lignes de tri, tandis que des véhicules autonomes assurent les flux au sol. À noter : les chiffres de cadence (1 200 colis/heure) émanent des médias d'État et n'ont pas été vérifiés de manière indépendante, et les vidéos publiées ne montrent que des séquences sélectionnées dans des conditions optimales. Ce déploiement marque une inflexion notable dans la stratégie d'automatisation logistique. Les robots humanoïdes présentent un avantage structurel par rapport à l'automatisation industrielle fixe : ils peuvent théoriquement opérer dans des infrastructures conçues pour les humains, sans nécessiter de refonte complète de l'entrepôt. Pour les intégrateurs et les décideurs B2B, cela réduit la barrière à l'entrée par rapport aux systèmes dédiés qui exigent une architecture entrepôt repensée de zéro. La logistique devient ainsi le premier secteur à tester à grande échelle la promesse de la robotique humanoïde en conditions réelles, au-delà des démos en laboratoire, dans un environnement à forte pression opérationnelle (24h/24, volumes croissants portés par l'e-commerce, pénuries de main-d'oeuvre régionales). C'est précisément ce contexte de charge élevée et continue qui permet d'évaluer si le gap sim-to-real est réellement comblé. China Post Group s'inscrit dans une dynamique nationale soutenue par des investissements publics massifs dans la robotique humanoïde, avec des acteurs comme Unitree, Fourier Intelligence et UBTECH qui cherchent à commercialiser leurs systèmes dans l'industrie, les services à la personne et la logistique. À l'international, les concurrents directs incluent Figure (avec son robot 02 déployé chez BMW), Agility Robotics (Digit chez Amazon) et 1X Technologies. La différence est que la Chine déploie à une échelle de volumes postaux nationaux, là où les déploiements occidentaux restent pour l'instant des pilotes industriels circonscrits. Des interrogations légitimes subsistent sur la fiabilité à long terme, les coûts de maintenance et la pertinence économique face à des alternatives plus simples comme les AMR (robots mobiles autonomes). Mais la décision de China Post de franchir le seuil du déploiement opérationnel à grande échelle, plutôt que de rester en mode pilote, constitue en soi un signal industriel significatif.

UELe déploiement à grande échelle de robots humanoïdes par China Post accentue le retard compétitif des intégrateurs et constructeurs européens, qui restent cantonnés à des pilotes industriels circonscrits face à une automatisation logistique humanoïde déjà opérationnelle à l'échelle nationale en Chine.

Chine/AsieOpinion
1 source
NIST propose un benchmark de référence pour évaluer les performances des robots humanoïdes
83The Robot Report 

NIST propose un benchmark de référence pour évaluer les performances des robots humanoïdes

Le National Institute of Standards and Technology (NIST) a publié en avril 2026 une proposition de référentiel de performance standardisé pour les robots humanoïdes, décrit comme un ensemble de tâches de locomotion et de manipulation à faible empreinte logistique. C'est le premier cadre d'évaluation de ce type depuis le DARPA Robotics Challenge de 2015, selon Aaron Prather, directeur du programme Robotics & Autonomous Systems chez ASTM International. Le benchmark couvre quatre dimensions : la mobilité de base (agnostic au domaine d'application), la manipulation et la dextérité, les capacités combinées loco-manipulation, le contrôle en espace contraint, et un niveau minimal de raisonnement et de compréhension de scène. Le NIST prévoit de fabriquer un nombre limité d'appareils de test physiques pour les distribuer gratuitement aux fabricants américains d'humanoïdes et aux centres de test régionaux, et de publier les plans et modèles 3D pour usage en environnement physique ou virtuel (simulateurs de training et de développement de contrôle). Les données collectées seront agrégées sous des accords de partage préapprouvés protégeant la propriété intellectuelle. L'absence de standard commun est un problème structurel pour le secteur : Tesla Optimus, Figure, Agility Robotics, Apptronik, Unitree et une douzaine d'autres plateformes humanoïdes ont attiré des milliards de dollars d'investissement ces dix dernières années sans qu'il existe de méthode consensuelle pour mesurer ce qu'elles font réellement. Comme le note Prather, "les vidéos marketing ont comblé le vide". Pour un intégrateur industriel ou un décideur B2B, l'absence de benchmarks opposables rend toute comparaison entre plateformes impossible et ralentit les décisions d'achat. Ce référentiel, s'il est adopté, permettrait d'objectiver le fossé entre démo et déploiement réel, de quantifier les progrès en loco-manipulation et en whole-body control, et d'offrir aux chercheurs une baseline reproductible. Il représente aussi un signal réglementaire potentiel : un benchmark NIST peut devenir une norme de fait pour les appels d'offres gouvernementaux américains. Ce projet s'appuie sur la collaboration antérieure du NIST avec le DARPA pour évaluer les capacités humanoïdes dans l'industrie et la recherche académique. En Europe, le Fraunhofer IPA (Stuttgart) a publié ce mois-ci son propre référentiel de sécurité et de développement pour humanoïdes, structuré autour de six critères, signalant que la course aux standards est désormais transatlantique. Aucun acteur français ou européen n'est directement impliqué dans la proposition NIST à ce stade, bien que des entreprises comme Enchanted Tools ou Wandercraft pourraient être concernées si ce cadre influence les standards ISO ou CEN. Le NIST est en phase de consultation et recherche des participants, fabricants comme labos, pour affiner la liste des tâches et tester leurs robots dans les installations NIST ou partenaires. Aucune date de finalisation n'est annoncée.

UELe Fraunhofer IPA a publié ce même mois son propre référentiel de sécurité pour humanoïdes, signalant une course transatlantique aux standards ; si le benchmark NIST influence les normes ISO/CEN, des acteurs européens comme Enchanted Tools ou Wandercraft devront adapter leur processus de qualification.

InfrastructureOpinion
1 source
MonoDuo : apprendre des politiques bimanuelles avec un seul bras robotique
84arXiv cs.RO 

MonoDuo : apprendre des politiques bimanuelles avec un seul bras robotique

Des chercheurs proposent avec MonoDuo (arXiv:2505.29298) une méthode pour entraîner des politiques de manipulation bimanuelles sans disposer de robots à deux bras. La collecte de données est hybride: un opérateur téléopère un bras unique pour exécuter un côté d'une tâche bimanuelles, un humain réalisant l'autre côté, puis les rôles sont inversés pour couvrir les deux membres. Les séquences RGB-D, capturées par une caméra de poignet et une caméra fixe, sont transformées en démonstrations synthétiques calibrées sur la cinématique du robot bimanuel cible, via estimation de pose des mains, segmentation de nuage de points et inpainting. Testé sur cinq tâches (soulèvement d'une boîte, remplissage d'un sac à dos, pliage d'un vêtement, fermeture d'une veste à glissière, passage d'une assiette), MonoDuo atteint jusqu'à 70% de taux de réussite en déploiement zero-shot sur des configurations bimanuelles non vues à l'entraînement. Avec seulement 25 démonstrations supplémentaires sur le robot cible, un fine-tuning few-shot améliore ces résultats de 65 à 70% par rapport à un entraînement depuis zéro. Le verrou adressé est structurel: les robots à deux bras coordonnés restent rares et onéreux dans les laboratoires de recherche, alors que les bras uniques sont omniprésents. Cette asymétrie crée un goulot d'étranglement dans la constitution de datasets pour les tâches bimanuelles, freinant le développement de politiques viables aussi bien pour les humanoïdes commerciaux que pour les cellules industrielles bimanuelles. MonoDuo montre qu'il est possible de bootstrapper ces politiques sans matériel dédié, réduisant considérablement le coût d'entrée. La réussite du déploiement zero-shot sur des configurations non vues est notable dans un domaine où le sim-to-real gap reste un obstacle structurel, et le gain de 65 à 70% obtenu avec seulement 25 démonstrations de fine-tuning constitue un signal positif pour les intégrateurs ne pouvant se permettre des milliers de cycles de collecte. Ce travail s'inscrit dans la lignée d'ALOHA, de UMI (Universal Manipulation Interface) et de Diffusion Policy, qui cherchent à décorréler la plateforme de collecte de la plateforme cible. L'essor des humanoïdes commerciaux (Figure 03, Tesla Optimus Gen 3, Unitree G1, 1X Eve) relance l'intérêt pour la manipulation bimanuelles à grande échelle. En Europe, Pollen Robotics avec son robot open-source Reachy et Enchanted Tools avec Miroki travaillent sur des problématiques similaires d'efficacité des démonstrations. MonoDuo reste à ce stade un preprint académique sans déploiement industriel annoncé; ses résultats devront être confirmés hors conditions de laboratoire pour valider leur transposabilité opérationnelle.

UEPollen Robotics et Enchanted Tools, qui développent des robots bimanuels en Europe, pourraient exploiter cette méthode pour constituer des datasets bimanuels à moindre coût sans dupliquer leur parc matériel.

RecherchePaper
1 source
La nouvelle usine d'ENGINEAI (12 000 m²) produit un robot humanoïde toutes les 15 minutes
85Interesting Engineering 

La nouvelle usine d'ENGINEAI (12 000 m²) produit un robot humanoïde toutes les 15 minutes

ENGINEAI, startup robotique fondée en octobre 2023 et basée à Shenzhen, a inauguré une usine de fabrication en série de robots humanoïdes dans le district de Honghualing. L'installation couvre environ 12 000 m² et intègre l'ensemble de la chaîne de valeur : contrôle qualité entrant, tests de composants, assemblage, tests pré-expédition, logistique et service après-vente. Selon l'entreprise, la cadence de production atteint un robot toutes les 15 minutes, soit potentiellement jusqu'à 35 000 unités par an en rythme continu. Chaque machine doit passer 79 contrôles qualité et 46 tests de simulation avant expédition. Les premiers exemplaires du T800, robot humanoïde polyvalent à vocation industrielle lourde, ont déjà quitté la chaîne. En parallèle, ENGINEAI prépare un second site à Zhengzhou, dans la province du Henan, dédié à une ligne de production de 10 000 unités supplémentaires, intégrée dans le Yunzhi Science Park. Cette expansion s'appuie sur une levée de fonds de série B de 200 millions de dollars clôturée en avril 2026, valorisant la société à plus de 10 milliards de yuans (environ 1,4 milliard de dollars). Le passage à une production industrielle cadencée représente un signal structurant pour le secteur. Jusqu'ici, la quasi-totalité des constructeurs d'humanoïdes, y compris des acteurs bien financés comme Figure ou 1X, opéraient en mode artisanal ou semi-série, avec des volumes annuels comptés en dizaines ou centaines d'unités. Une cadence de 1 robot toutes les 15 minutes, si elle est confirmée en régime nominal et non seulement revendiquée en pic de démo, constituerait une rupture dans le ratio coût/volume. Elle valide aussi l'hypothèse que le goulot d'étranglement de la filière n'est plus uniquement logiciel (contrôleurs, VLA, sim-to-real), mais bien industriel. Pour les intégrateurs et décideurs B2B, cela change le calcul : la question n'est plus "aura-t-on accès à des robots ?" mais "à quel prix et avec quel support ?" La précision des 79 points de contrôle et 46 tests de simulation suggère une démarche sérieuse de standardisation, même si ENGINEAI n'a pas publié de données indépendantes sur les taux de défauts ou la fiabilité terrain. ENGINEAI s'inscrit dans une vague d'industriels chinois qui accélèrent sur l'humanoïde depuis 2024, portés par des politiques publiques favorables et une base de fournisseurs actuateurs/capteurs mature dans la région de Shenzhen. La société commercialise quatre plateformes : le T800 (humanoïde lourd), le PM01 (humanoïde généraliste), le SA02 (robot compagnon léger) et le JS01 (quadrupède). Ses cibles déclarées sont l'industrie et l'inspection, soit les mêmes segments qu'Agility Robotics (Digit, déployé chez Amazon), Figure (accord BMW), Unitree ou Fourier Intelligence. Sur le plan concurrentiel, la proximité géographique avec les fournisseurs de la chaîne d'approvisionnement shenzhenoise constitue un avantage structurel face aux acteurs américains. Les prochaines étapes annoncées incluent la montée en puissance du site de Zhengzhou et l'atteinte du seuil des 10 000 unités cumulées, sans calendrier précis communiqué à ce stade.

UELa montée en capacité industrielle cadencée de la filière humanoïde chinoise accentue la pression sur les intégrateurs et constructeurs européens (ABB, KUKA, Stäubli) : si les chiffres se confirment en régime nominal, le ratio coût/volume change structurellement et les décideurs B2B européens devront revoir leurs calculs de TCO pour leurs lignes de production d'ici 2027.

Chine/AsieOpinion
1 source
Guide complet des événements du Robotics Summit & Expo 2026
86The Robot Report 

Guide complet des événements du Robotics Summit & Expo 2026

Le Robotics Summit & Expo 2026 ouvre ses portes le 27 mai à Boston, au Thomas M. Menino Convention & Exhibition Center. L'événement réunit plus de 5 000 experts de la robotique et 200 exposants sur deux jours, avec plus de 50 sessions réparties en cinq tracks : intelligence artificielle, design et développement, technologies habilitantes, santé et logistique. Plus de 70 intervenants représentent des acteurs comme Amazon Robotics, Universal Robots, Locus Robotics, Boston Dynamics, Agility, Tesla, le Toyota Research Institute, Harmonic Drive, maxon, PickNik Robotics et Intrinsic. La première journée s'ouvre à 9h par le panel "Building the Next Era of Robot Autonomy", avec Aaron Parness (directeur de la science appliquée chez Amazon Robotics), Anders Beck (VP produits AI robotics chez Universal Robots), Hamid Montazeri (SVP software et IA chez Locus Robotics) et John Wall (président de QNX). À 10h suivra le panel "The State of Humanoids", incluant Alberto Rodriguez (directeur du comportement robot pour Atlas chez Boston Dynamics) et Pras Velagapudi (CTO d'Agility Robotics). Le 28 mai, Brian Gerkey (board chair d'Open Robotics et CTO d'Intrinsic) livrera la keynote "An Open Foundation for the Age of AI-Powered Robots", et la conférence se clôturera par le témoignage de Noland Arbaugh, premier utilisateur d'un implant cérébral Neuralink. La concentration de sessions de haut niveau sur l'autonomie et les humanoïdes reflète le basculement du secteur d'une phase de démonstration vers une phase de commercialisation active. La présence d'Alberto Rodriguez (Boston Dynamics) et de Pras Velagapudi (Agility) sur le même panel humanoïde est révélatrice : ces deux entreprises sont actuellement les seules à pouvoir revendiquer des déploiements clients documentés à échelle industrielle, et leur coprésence sur scène illustre une compétition directe pour les contrats pilotes. Le thème porté par Gerkey (Intrinsic, filiale Alphabet) sur les fondations logicielles ouvertes pour robots IA pointe une tension structurelle du secteur : la fragmentation des stacks ROS freine l'interopérabilité, et plusieurs acteurs cherchent à imposer un middleware de référence avant que le marché ne se verrouille autour d'un standard propriétaire. Le Robotics Summit est organisé par The Robot Report et Peerless Media, et constitue l'un des deux grands rendez-vous professionnels de la robotique aux États-Unis avec RoboBusiness. L'édition 2026 se tient dans un contexte de forte pression concurrentielle sur le segment humanoïde : Figure AI, 1X, Apptronik, Unitree et Fourier Intelligence ont multiplié les annonces depuis dix-huit mois, tandis que les déploiements réels documentés restent rares. L'absence dans le programme de représentants de Figure AI ou de 1X peut indiquer un positionnement délibéré de ces acteurs en dehors des canaux de conférence traditionnels, ou simplement un agenda non finalisé. Les RBR50 Innovation Awards, remis lors du dîner du soir du 27 mai, constitueront un baromètre utile des projets jugés les plus significatifs par la communauté professionnelle cette année.

La Chine donne une carte d’identité aux robots humanoïdes : Bientôt le droit de vote ?
87Le Big Data 

La Chine donne une carte d’identité aux robots humanoïdes : Bientôt le droit de vote ?

La Chine a officiellement lancé vendredi une plateforme nationale d'identification des robots humanoïdes, baptisée « Plateforme de services de gestion du cycle de vie complet des humanoïdes ». Pilotée par le Comité de normalisation de la robotique humanoïde et de l'intelligence incarnée, rattaché au ministère chinois de l'Industrie et des Technologies de l'information, cette initiative attribue à chaque robot fabriqué en Chine un identifiant numérique unique, structuré en quatre blocs : un code pays à deux chiffres, un code fabricant à quatre chiffres, un code modèle à six chiffres, et un numéro de série à 17 chiffres pour distinguer chaque unité individuellement. Ce code accompagne la machine de sa fabrication jusqu'à son recyclage et s'applique à l'ensemble de la chaîne, industriels, distributeurs, prestataires, utilisateurs, centres de recyclage. Avant même le lancement officiel, environ 28 000 robots répartis sur 200 modèles disposaient déjà d'une identité numérique, signe que le déploiement était déjà largement anticipé par l'industrie. L'objectif déclaré est de répondre à des enjeux de sécurité, de contrôle et de gouvernance dans un secteur qui évolue plus vite que les réglementations censées l'encadrer. Yu Xiuming, directeur adjoint de l'Institut chinois de normalisation électronique, présente le système moins comme un outil de surveillance que comme une infrastructure industrielle indispensable avant tout déploiement international à grande échelle. Concrètement, la traçabilité complète de chaque unité doit renforcer la responsabilité des fabricants en cas d'incident, faciliter les rappels, et permettre aux autorités de surveiller l'utilisation des machines dans des environnements sensibles. Pour les entreprises, c'est aussi une forme de certification qui facilite l'export et la confiance des clients. Cette initiative s'inscrit dans un contexte de croissance explosive du secteur. Selon une étude IDC citée en janvier 2026, le marché mondial des robots humanoïdes a progressé de 508 % sur un an, avec environ 18 000 unités expédiées à l'échelle mondiale. La Chine est au cœur de cette dynamique, avec plus d'une centaine de fabricants actifs sur son territoire, des entreprises comme Unitree ou Fourier Intelligence ayant déjà attiré l'attention internationale. Pékin mise sur les humanoïdes comme levier stratégique dans sa course technologique face aux États-Unis, et ce système d'identification constitue une étape de normalisation classique dans tout secteur industriel arrivant à maturité. Il pose les bases d'un écosystème plus structuré, condition sine qua non pour que les robots humanoïdes quittent les laboratoires et les usines pilotes pour s'intégrer durablement dans l'économie réelle.

UELes entreprises européennes qui importent ou distribuent des robots humanoïdes fabriqués en Chine devront intégrer ce système d'identification dans leurs processus logistiques et de conformité.

💬 Le titre fait sourire, mais la vraie information c'est que la Chine vient de poser la première brique d'une infrastructure industrielle sérieuse pour les humanoïdes. 508% de croissance sur un an, ça ne se régule pas à la louche. Les boîtes européennes qui importent du chinois vont devoir intégrer ce standard dans leur chaîne, bon gré mal gré.

HumanoïdesReglementation
1 source
OCELOT : odométrie et estimation du contact pour robots à pattes
88arXiv cs.RO 

OCELOT : odométrie et estimation du contact pour robots à pattes

Une équipe de chercheurs a publié OCELOT (Odometry and Contact Estimation for Legged rObots), un pipeline complet d'odométrie pour robots à pattes reposant exclusivement sur des capteurs proprioceptifs embarqués : une centrale inertielle (IMU) solidaire du corps, des encodeurs articulaires et des capteurs de force. Le système s'appuie sur un filtre de Kalman à état d'erreur (ESEKF) dont l'état est corrigé par les pieds détectés en appui stationnaire. Sa contribution centrale est un module de détection de contact fusionnée et de quantification d'incertitude : deux détecteurs tournent en parallèle pour chaque pied, le premier combinant un modèle de mélange gaussien (GMM) avec une machine à états finis (FSM) à déclenchement anti-rebond sur les données de force, le second appliquant un test de rapport de vraisemblance généralisé (GLRT) sur la vélocité cinématique estimée du pied. Les scores continus issus des deux détecteurs sont fusionnés pour identifier les glissements. Pour valider l'approche, les auteurs ont constitué un dataset de 29 séquences couvrant 2,4 km sur des terrains variés (béton, herbe, graviers, rochers) et ont comparé OCELOT à des méthodes proprioceptives et extéroceptives. Le code et un package ROS2 temps réel sont publiés en open source. L'intérêt principal de OCELOT réside dans sa robustesse aux terrains glissants sans recourir à des capteurs extéroceptifs (caméra, lidar), qui restent coûteux, fragiles et sensibles aux conditions d'éclairage ou de poussière. Pour un intégrateur déployant un robot quadrupède en environnement industriel ou outdoor, disposer d'une odométrie fiable avec uniquement l'équipement embarqué de série réduit significativement la complexité système. La disponibilité d'un package ROS2 prêt à l'emploi abaisse la barrière d'adoption. Le benchmark face à des méthodes extéroceptives constitue un signal fort : il suggère que l'estimation de contact bien conçue peut rivaliser avec des approches visuelles sur des trajectoires courtes à moyennes. Les robots à pattes de type Spot (Boston Dynamics), ANYmal (ANYbotics) ou Unitree B2 sont les cibles naturelles de tels pipelines. L'odométrie proprioceptive pour quadrupèdes est un problème ouvert depuis des années, avec des travaux antérieurs comme Pronto (IIT) ou les pipelines d'ETH Zurich sur ANYmal. OCELOT se distingue par la combinaison explicite GMM+GLRT pour la détection de glissement, un point sensible dans les déploiements extérieurs. Les prochaines étapes probables incluent la validation sur des trajectoires longue distance et l'intégration dans des architectures SLAM proprioceptif complet.

UELa publication en open source d'un package ROS2 directement intégrable peut bénéficier aux intégrateurs et labos européens (ANYbotics/Suisse, IIT/Italie) déployant des quadrupèdes en environnements industriels ou extérieurs difficiles.

RecherchePaper
1 source
RoboJailBench : évaluation des attaques et défenses adversariales dans les agents robotiques incarnés
89arXiv cs.RO 

RoboJailBench : évaluation des attaques et défenses adversariales dans les agents robotiques incarnés

Des chercheurs du PurSec Lab ont publié RoboJailBench, un benchmark standardisé pour évaluer les attaques adversariales de type "jailbreak" et leurs contre-mesures dans les systèmes d'IA embarquée. Présenté sur arXiv (2605.19328), ce framework cible les agents robotiques et véhicules autonomes qui s'appuient sur des Vision-Language Models (VLMs) pour interpréter l'environnement visuel et exécuter des commandes en langage naturel. Il repose sur trois composantes: une taxonomie de sécurité dérivée des normes ISO et d'incidents documentés, couvrant 18 catégories de violations; un pipeline de données "intent contrast" associant à chaque exemple un objectif adversarial et un objectif bénin, afin de mesurer conjointement sécurité et utilité; et un dépôt évolutif de métriques standardisées. Les auteurs ont construit un dataset taxonomique, enrichi cinq datasets existants, intégré quatre types d'attaques et deux défenses, puis évalué l'ensemble sur les principaux VLMs embarqués actuels. Un leaderboard public est maintenu sur purseclab.github.io. L'enjeu dépasse la recherche académique. Un robot compromis par un jailbreak n'affiche pas une réponse textuelle inappropriée: il exécute une action physique potentiellement dangereuse. Les benchmarks existants ciblaient soit les LLMs conversationnels, soit la sécurité non-adversariale des agents incarnés, sans jamais capturer le triptyque risques adversariaux, conséquences physiques et arbitrage sécurité-utilité. Quantifier explicitement ce compromis est une contribution méthodologique significative: un système trop défensif bloque des commandes légitimes et devient inutilisable en production. Pour les intégrateurs industriels, une grille d'évaluation ancrée dans les normes ISO simplifie la qualification réglementaire avant tout déploiement réel. La montée en puissance des VLMs dans la robotique physique, illustrée par pi0 de Physical Intelligence, GR00T N2 de NVIDIA ou les architectures de Figure AI, a considérablement élargi la surface d'attaque des systèmes autonomes. Des travaux antérieurs avaient documenté la vulnérabilité des agents embarqués aux jailbreaks visuels ou textuels, mais sans cadre d'évaluation reproductible. Alors que des fabricants comme Boston Dynamics, Unitree ou, côté européen, Enchanted Tools intègrent des VLMs en production, la robustesse adversariale est appelée à devenir une exigence réglementaire dans les secteurs logistique, manufacturier et médical. RoboJailBench pose une base commune sur laquelle industriels et académiques peuvent s'appuyer pour standardiser ces tests avant mise en service.

UELe benchmark RoboJailBench, ancré dans les normes ISO, fournit aux intégrateurs européens, dont Enchanted Tools (France) qui déploie des VLMs en production, un cadre standardisé pour qualifier la robustesse adversariale avant mise en service sous les exigences de l'AI Act.

Societe/EthiqueOpinion
1 source
Marche, course et récupération unifiées pour robots humanoïdes via des priors de mouvement adversariaux adaptatifs
90arXiv cs.RO 

Marche, course et récupération unifiées pour robots humanoïdes via des priors de mouvement adversariaux adaptatifs

Une équipe de chercheurs a publié fin mai 2026 sur arXiv (arXiv:2605.18611) un framework d'apprentissage par renforcement unifié permettant à un seul contrôleur de faire marcher, courir et se relever après une chute le robot humanoïde Unitree G1, sans commande explicite de changement de mode au déploiement. L'approche étend les Adversarial Motion Priors (AMP) en remplaçant la distribution de référence globale par un mécanisme de routage conditionné à l'état : un seuil fixe sur la gravité projetée (|gz+1| > 0,6, soit environ 37° d'inclinaison du torse par rapport à la verticale) aiguille chaque transition d'entraînement soit vers un discriminateur dédié à la récupération, soit vers un discriminateur de locomotion conditionné par la vitesse commandée, qui couvre à la fois la marche et la course. Seuls trois clips de motion capture extraits du jeu de données LAFAN1 sont nécessaires pour régulariser l'ensemble du comportement. Sur hardware réel, la politique tourne à 50 Hz sous forme d'un fichier ONNX figé, sans aucune logique de mode à l'exécution, et valide des relevés réussis depuis les positions ventrale et dorsale ainsi que des transitions fluides marche-course. Ce résultat s'attaque directement à un problème d'intégration récurrent dans la robotique humanoïde commerciale : la fragmentation en contrôleurs spécialisés par mode, reliés par des automates à états qui génèrent des zones de transition fragiles et coûteuses à maintenir. Démontrer qu'une politique apprise par RL couvre ces régimes de façon continue sur hardware réel, et non uniquement en simulation, affaiblit l'argument du sim-to-real gap rédhibitoire pour les comportements complexes. Le coût d'annotation est lui aussi remarquablement bas : trois clips de reference suffisent là où d'autres travaux en exigent des dizaines, ce qui rend la méthode potentiellement transférable à d'autres plateformes avec un effort de données limité, qu'il s'agisse du PAL Robotics TALOS, du MIROKAÏ d'Enchanted Tools, ou de tout humanoïde léger à faible budget de motion capture. La publication s'inscrit dans une course dense à la locomotion humanoïde robuste, où Boston Dynamics (Atlas), Figure (Figure 03), Agility Robotics (Digit) et Tesla (Optimus Gen 3) investissent massivement, mais publient peu. Sur le plan académique, des approches concurrentes comme les VLA (Vision-Language-Action models) de Physical Intelligence ou les travaux de Berkeley visent des politiques encore plus générales, mais sacrifient souvent la robustesse physique au profit de la flexibilité sémantique. L'utilisation du Unitree G1, disponible à environ 16 000 dollars et largement répandu dans les laboratoires, confère à ces travaux une reproductibilité pratique supérieure aux publications sur plateformes fermées. L'article ne précise pas de timeline de déploiement industriel, mais la compatibilité ONNX et l'absence de logique embarquée à l'exécution réduisent la barrière à l'intégration pour un OEM ou un intégrateur souhaitant évaluer la méthode sur sa propre plateforme.

UELa méthode, compatible ONNX et nécessitant seulement 3 clips de motion capture, est explicitement identifiée comme transférable au MIROKAÏ d'Enchanted Tools (FR) et au TALOS de PAL Robotics (EU), réduisant le coût d'adaptation pour les équipes de recherche et les intégrateurs européens.

RecherchePaper
1 source
Derrière le marathon robotique d'Honor : 7 fournisseurs chinois au service du robot Lightning
91Pandaily 

Derrière le marathon robotique d'Honor : 7 fournisseurs chinois au service du robot Lightning

Le 19 avril, sur le parcours semi-marathon de 21,0975 kilomètres du district de Yizhuang à Pékin, le robot humanoïde "Lightning" d'Honor, engagé sous l'étiquette de l'équipe Qitian Daxiansen, a franchi la ligne d'arrivée en 50 minutes et 26 secondes nets. Ce temps réduit de près des deux tiers le record de la compétition établi l'année précédente à 2 heures 40 minutes, et passe sous la barre du record du monde du semi-marathon masculin humain, fixé à 57 minutes et 20 secondes. Ce qui retient davantage l'attention que la performance brute, c'est la chaîne d'approvisionnement entièrement domestique qui sous-tend le robot : GigaDevice (兆易创新) fournit les puces NOR Flash et MCU pour le calcul et le stockage embarqués ; Lingyi iTech (领益智造) livre les composants structuraux de précision et les boîtiers assurant la gestion thermique ; Lens Technology (蓝思科技) produit les optiques de perception visuelle ; AAC Technologies (瑞声科技) contribue aux capteurs haute précision et aux composants acoustiques. Plusieurs autres fournisseurs non nommés couvrent les systèmes de motorisation, de gestion d'énergie et de capteurs de précision. Pour les intégrateurs et décideurs industriels, ce résultat constitue un signal plus structurel que conjoncturel. Il invalide en partie l'hypothèse du "demo gap" : "Lightning" a performé sous les contraintes d'un événement chronométré public, pas en environnement lab. Plus significatif encore, l'ensemble de la chaîne de valeur critique (semi-conducteurs, optique, acoustique, mécanique de précision) provient d'acteurs cotés en Chine, indiquant une autonomie croissante vis-à-vis des fournisseurs occidentaux ou japonais pour les composants humanoides. Ce n'est pas anecdotique dans un contexte de restrictions export sur puces avancées. Honor, connu comme fabricant de smartphones et ex-marque de Huawei, s'est positionné dans la robotique humanoïde depuis 2024, période de montée en puissance massive du secteur en Chine. La compétition de Yizhuang s'inscrit dans une série de benchmarks outdoor visant à différencier les constructeurs capables d'endurance réelle des acteurs encore en phase de démonstration vidéo. Les concurrents directs dans la course humanoïde incluent Unitree, Agibot et Fourier Intelligence côté chinois, ainsi que Figure (Figure 03), Tesla (Optimus Gen 3) et Physical Intelligence (pi0) côté américain. L'article source ne précise ni roadmap de déploiement commercial pour "Lightning" ni pilotes industriels annoncés, ce qui invite à traiter ce résultat comme un jalon technique plutôt qu'un produit shipé.

UELe découplage de la chaîne d'approvisionnement humanoïde chinoise vis-à-vis des fournisseurs occidentaux (semi-conducteurs, optique, mécanique de précision) fragilise à terme la compétitivité des équipementiers européens et renforce le débat autour des contrôles à l'export sur composants avancés.

Chine/AsieOpinion
1 source
MVB-Grasp : filtrage par boîte de volume minimal des saisies par diffusion pour la manipulation frontale
92arXiv cs.RO 

MVB-Grasp : filtrage par boîte de volume minimal des saisies par diffusion pour la manipulation frontale

Une équipe de chercheurs a publié sur arXiv (référence 2505.09672) MVB-Grasp, un système de saisie robotique conçu pour le bras Unitree Z1, un manipulateur à 6 degrés de liberté (DOF) positionné en configuration frontale, c'est-à-dire face à l'objet plutôt qu'en vue surplombante. Le dispositif expérimental associe une caméra Intel RealSense D405, un détecteur d'objets YOLOv8 et le générateur de prises GraspGen basé sur la diffusion. L'innovation centrale est un filtre géométrique fondé sur la boîte englobante de volume minimal orientée (MVBB) : en analysant les normales des faces de cette boîte en temps O(N), le système élimine les candidats de saisie qui traverseraient la table ou s'aligneraient mal avec les faces accessibles de l'objet. Une fonction de re-scoring combine le score du discriminateur appris et l'alignement géométrique avec un coefficient alpha fixé à 0,85. Sur 81 épisodes de simulation MuJoCo (cylindre, boîte asymétrique, bouteille d'eau), MVB-Grasp atteint 59,3 % de succès contre 24,7 % pour GraspGen seul, soit un gain de 2,4x, confirmé ensuite en conditions réelles sans nécessiter de ré-entraînement du modèle. Ce résultat est notable parce qu'il pointe un angle mort structurel de la recherche en manipulation : les benchmarks standards comme GraspNet-1Billion ou YCB-Video sont quasi-exclusivement conçus pour des caméras en vue de dessus sur des manipulateurs haut de gamme à large espace de travail. Or une part croissante des déploiements industriels et de service implique des bras montés sur des piédestaux fixes ou des AMR, en saisie frontale, avec des contraintes cinématiques sévères. Le fait que le gain soit obtenu sans ré-entraînement, uniquement par un filtre géométrique injecté en post-traitement, démontre que le "sim-to-real gap" dans ces configurations n'est pas seulement un problème de données mais aussi de biais dans la sélection des poses candidates. C'est une piste directement exploitable pour les intégrateurs qui déploient des manipulateurs à bas coût dans des cellules contraintes. Le Unitree Z1 est un bras compact vendu autour de 4 000 à 6 000 dollars, souvent utilisé en recherche académique comme alternative économique aux UR5 ou Franka Panda. La diffusion appliquée à la génération de prises est un axe actif depuis 2022-2023 (GraspGen, SE(3)-DiffusionFields, DexGraspNet 2.0), mais la majorité des travaux optimisent pour des postures overhead. Côté concurrents directs sur les manipulateurs frontaux contraints, les approches d'Enchanted Tools et les travaux issus du LAAS-CNRS en France explorent des contraintes similaires, bien que sur des plateformes différentes. La prochaine étape logique pour cette équipe serait d'étendre le protocole à des objets articulés ou transparents, et d'intégrer le filtre MVBB dans une boucle de planification réactive plutôt qu'en sélection statique de candidats.

UELe filtre MVBB est directement exploitable sans ré-entraînement par des intégrateurs européens déployant des manipulateurs en configuration frontale sur AMR ou piédestaux fixes, et s'inscrit dans la continuité de travaux menés au LAAS-CNRS et chez Enchanted Tools en France sur des contraintes cinématiques similaires.

💬 Un filtre géométrique pur, injecté en post-traitement, qui multiplie le taux de succès par 2,4 sans ré-entraîner le modèle : c'est le genre de résultat qui devrait faire rougir pas mal d'équipes qui empilent des couches de deep learning là où une contrainte bien posée suffit. Ce qui est vraiment utile ici, c'est qu'ils pointent un biais structurel évident en retrospective : tous les benchmarks standards supposent une caméra en vue de dessus, alors que la moitié des bras déployés en prod sont en configuration frontale sur des AMR ou des piédestaux fixes. Le filtre MVBB, tu peux le brancher demain sur ton pipeline existant.

IA physiquePaper
1 source
Muninn : un modèle de diffusion de trajectoires, désormais plus rapide
93arXiv cs.RO 

Muninn : un modèle de diffusion de trajectoires, désormais plus rapide

Une équipe de chercheurs a publié Muninn (arXiv:2605.09999), un module d'accélération sans réentraînement pour les planificateurs de trajectoires basés sur la diffusion. Le système atteint jusqu'à 4,6x de gain en vitesse d'exécution sur plusieurs architectures de diffusion en espace d'état, sans dégradation mesurée des performances ni des métriques de sécurité. Muninn fonctionne comme un wrapper de cache : à chaque étape du débruitage itératif, il choisit en temps réel de recalculer la sortie du denoiser ou de réutiliser le résultat mis en cache. Cette décision repose sur deux signaux analytiques calibrés hors-ligne, une sonde légère de l'évolution de la représentation interne de la trajectoire et des coefficients de propagation d'erreur du denoiser, qui produisent ensemble un budget d'incertitude par étape. Ce budget borne formellement l'écart maximal entre la trajectoire mise en cache et celle qui aurait été calculée à pleine puissance de calcul. Les gains ont été validés sur matériel réel, en navigation en boucle fermée et en manipulation. La lenteur des modèles de diffusion en planification de trajectoires est un verrou bien identifié pour la robotique temps-réel. Les accélérations existantes imposaient jusqu'ici un compromis inévitable : modifier le sampler dégradait la qualité de trajectoire, tandis que la compression du réseau nécessitait un réentraînement coûteux. Muninn contourne ce dilemme en opérant strictement sans modifier les poids du modèle, ce qui le rend applicable immédiatement à n'importe quel planificateur diffusion déjà entraîné. Pour un intégrateur ou une équipe robotique industrielle, cela rend concrètement viables des architectures comme Diffusion Policy dans des boucles de contrôle haute fréquence. La certification analytique des bornes de déviation constitue un argument de poids pour les déploiements où la sécurité est une contrainte réglementaire. Les politiques par diffusion appliquées à la robotique ont émergé vers 2022-2023, portées notamment par Diffusion Policy (Chi et al., Columbia University), et se sont depuis déployées dans des architectures VLA et des planificateurs en espace d'état. Les méthodes d'accélération antérieures, DDIM et distillation par connaissance en tête, ne proposaient pas de cache adaptatif avec bornes certifiées, ce qui positionne Muninn comme une surcouche orthogonale et rétrocompatible avec l'existant. En tant que preprint arXiv, les résultats n'ont pas encore été soumis à revue par les pairs. Les prochaines étapes logiques concernent les stacks robotiques humanoïdes et industriels (Figure, Unitree, Boston Dynamics) qui expérimentent des politiques diffusion et cherchent à réduire la latence de planification en production. Le code est publié publiquement sur GitHub (gokulp01/Muninn).

RecherchePaper
1 source
À Silicon Valley, des entreprises d'IA incarnée chinoises et américaines échangent sur 4 problèmes clés
9436Kr 

À Silicon Valley, des entreprises d'IA incarnée chinoises et américaines échangent sur 4 problèmes clés

Le 28 avril 2026, MagicLab a tenu à San José sa Global Embodied Intelligence Summit (GEIS), en présence de représentants d'Adobe, TikTok et IBM. La société a présenté trois nouveaux produits : le modèle-monde Magic-Mix, construit sur deux moteurs, Magic-WAM pour la compréhension du monde réel et Magic-Creator pour la génération de données synthétiques en boucle fermée ; la main dextre MagicHand H01, 20 DOF et 44 capteurs tactiles 3D haute résolution ; le robot humanoïde MagicBot X1, 180 cm, 70 kg, 31 DOF actifs, couple articulaire maximal de 450 N·m, fonctionnement continu 24h/7j via double batterie. Ces annonces s'accompagnent d'un objectif commercial de 14 milliards de dollars de revenus d'ici 2036, un chiffre que la société ne détaille pas. La conférence s'inscrit dans une accélération visible du secteur : Zhiyuan Robotics a annoncé sa 10 000e unité en à peine trois mois (de 5 000 à 10 000 robots) ; Unitree affiche dans son prospectus d'IPO 1,707 milliard de RMB de chiffre d'affaires 2025, plus de 5 500 unités expédiées, et plus de 50 % du revenu réalisé à l'international. La GEIS a structuré quatre débats techniques majeurs pour le secteur. Sur la donnée d'entraînement, la stratégie dominante est le mix : MagicLab collecte environ 16 000 trajectoires réelles par jour et les amplifie d'un facteur 10 000 par synthèse, ciblant l'assemblage automobile électrique comme gisement prioritaire (60 à 70 % de processus encore manuels). Zhengyi Luo du NVIDIA GEAR Lab détaille la répartition de son équipe : 50 % données simulées, 15 % motion capture, 25 % vidéos internet, 10 % données réelles haute qualité. Haozhi Qi, chercheur à l'Amazon Frontier AI and Robotics, pose la limite de la synthèse : elle fonctionne pour les compétences élémentaires, pas pour les tâches à horizon long comme préparer un repas. Sur les architectures VLA (vision-langage-action), Qi explique leur dominance actuelle par la maturité des capteurs visuels face aux capteurs tactiles encore embryonnaires, VLA compensant ainsi le déficit sensoriel par la modalité visuelle. Sur les mains dextres, Evan Tao de Chestnut Robotics, ancien membre clé de l'équipe Tesla Optimus, défend une architecture hybride tendons plus IA, recherchant l'équilibre entre manipulation fine et robustesse industrielle. Sur la mise à l'échelle, Jan Liphardt, cofondateur d'OpenMind et professeur associé à Stanford en bioingénierie, recommande un déploiement terrain le plus précoce possible : laboratoires et simulations ne reproduisent pas lumière intense, sols humides ou charnières oxydées, conditions qui révèlent les défaillances systémiques des robots. La tenue de la GEIS en Californie traduit un repositionnement stratégique des acteurs robotiques chinois vers les marchés industriels occidentaux. MagicLab affronte Figure AI, Agility Robotics et Boston Dynamics sur le segment humanoïde industriel, tout en concurrençant Unitree et Zhiyuan sur son marché domestique. La présence de PrismaX, OpenMind et XGSynBot confirme que la commercialisation de la robotique humanoïde est désormais transatlantique. Les déploiements pilotes annoncés visent des usines d'assemblage et des environnements publics, aéroports, écoles, lieux de soins, avec pour objectif explicite d'accumuler des données d'interaction que les simulations les plus sophistiquées ne peuvent pas générer.

UEL'expansion transatlantique des constructeurs chinois (MagicLab, Unitree, Zhiyuan) vers les marchés industriels occidentaux intensifie la pression concurrentielle sur les intégrateurs et fabricants robotiques européens, sans déploiement explicite en Europe annoncé à ce stade.

💬 Zhiyuan passe de 5 000 à 10 000 robots en trois mois, Unitree fait déjà plus de la moitié de son CA à l'export. C'est ça la vraie info, pas les 14 milliards de revenus d'ici 2036 (ça, ça sent la slide investisseur non étayée). Le truc que je retiens de Liphardt : ni labo ni simulation ne reproduisent une charnière oxydée, donc déploie en usine le plus tôt possible.

HumanoïdesOpinion
1 source
Figure affirme produire un robot humanoïde par heure, soit une multiplication par 24 en quatre mois
95Interesting Engineering 

Figure affirme produire un robot humanoïde par heure, soit une multiplication par 24 en quatre mois

Figure, la startup californienne spécialisée en robotique humanoïde, a annoncé avoir atteint un rythme de production d'un robot Figure 03 par heure dans son usine BotQ, située en Californie. Ce chiffre représente une multiplication par 24 du cadence de fabrication en moins de quatre mois, partant d'un robot par jour début 2026. Plus de 350 unités ont été livrées à ce jour, plus de 500 batteries expédiées, et plus de 9 000 actionneurs produits. La ligne de fabrication s'appuie sur un logiciel propriétaire déployé sur plus de 150 postes de travail en réseau, avec plus de 50 points d'inspection intermédiaires. Le taux de réussite en fin de ligne (first-pass yield) dépasse 80 %, et le rendement de production des batteries atteint 99,3 %. Chaque unité subit plus de 80 tests fonctionnels incluant des exercices de stress mécanique (squats, jogging) avant expédition. L'objectif affiché reste de 12 000 robots par an à pleine capacité. Ce passage du stade prototype à la production industrielle est significatif dans la course aux humanoïdes, où la majorité des acteurs restent encore dans des phases de démonstrateur ou de déploiement pilote très limité. Un taux de rendement end-of-line supérieur à 80 % sur un produit mécatronique aussi complexe est un indicateur industriel crédible, bien que Figure ne précise pas la définition exacte de ce seuil ni les conditions de test. En parallèle, Figure a publié une mise à jour majeure de son modèle d'IA Helix, baptisée System 0 (S0). L'ancienne version reposait uniquement sur la proprioception (états articulaires, posture). S0 intègre désormais des caméras stéréo embarquées qui génèrent une représentation 3D de l'environnement, permettant au robot de naviguer des escaliers et des terrains variés avec une stabilité décrite comme comparable à celle d'un humain. Le système est entraîné par renforcement en simulation sur des terrains aléatoires, et les comportements appris se transfèrent directement au monde réel sans recalibration, ce qui constitue une avancée notable sur le classique problème du sim-to-real gap. Figure a été fondée en 2022 par Brett Adcock et a levé plus de 675 millions de dollars, dont une ronde notable en 2024 avec des participations de Microsoft, Nvidia, OpenAI et Samsung. Le Figure 03 est la troisième génération de son robot humanoïde, succédant au Figure 01 et 02. Dans un secteur extrêmement concurrentiel, Figure se positionne face à Tesla (Optimus Gen 2), Boston Dynamics (Atlas électrique), Agility Robotics (Digit, déployé chez Amazon), Physical Intelligence (Pi-0) et Unitree. La montée en volume de BotQ est aussi une course aux données : plus de robots déployés signifie davantage de données réelles pour entraîner Helix. Figure indique viser des déploiements dans les secteurs de la recherche, du commercial et de l'usage domestique, sans préciser de calendrier client ni de prix public pour le Figure 03.

HumanoïdesActu
1 source
Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation
96arXiv cs.RO 

Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation

Des chercheurs ont publié sur arXiv (arXiv:2604.17258, avril 2026) un pipeline de déploiement rapide permettant de préparer un robot humanoïde à manipuler un nouvel objet en environ 30 minutes, contre un à deux jours dans les approches classiques. Le système s'appuie sur trois composants à base de modèles de fondation : l'annotation automatique via Roboflow pour entraîner un détecteur YOLOv8, la reconstruction 3D par Meta SAM 3D à partir d'images standard (smartphone suffisant, pas de scanner laser), et le suivi de pose 6-DoF en zero-shot par FoundationPose, qui utilise directement le maillage généré par SAM 3D comme gabarit. Les commandes de pose alimentent un planificateur de cinématique inverse sous Unity, transmises en UDP au robot Unitree G1 via le SDK propriétaire. Les métriques annoncées : mAP@0.5 = 0,995 en détection, précision de suivi σ inférieure à 1,05 mm, et saisie réussie sur cinq positions dans l'espace de travail. Le pipeline a également été validé sur une tâche d'application de mastic sur vitre d'automobile, ce qui constitue un environnement industriel concret. L'enjeu principal est la réduction du "time-to-deployment" pour la manipulation humanoïde, un goulot d'étranglement majeur qui freine l'intégration en environnement industriel réel. Passer de deux jours à 30 minutes sans équipement spécialisé change la donne pour les intégrateurs et les PME industrielles qui ne disposent pas d'équipes robotique dédiées. Le recours au zero-shot pour FoundationPose signifie qu'aucun réentraînement n'est nécessaire pour chaque nouvel objet, ce qui valide partiellement l'hypothèse que les modèles de fondation peuvent absorber la variabilité d'objets sans collecte de données lourde. Cela dit, les résultats sont présentés sur cinq positions fixes et deux tâches seulement ; la robustesse en conditions de production non contrôlées reste à démontrer. Le robot support, le Unitree G1, est un humanoïde commercial chinois à 16 degrés de liberté vendu autour de 16 000 dollars, positionné comme plateforme de recherche accessible. Les composants logiciels mobilisés (Roboflow, Meta SAM 3D, FoundationPose de NVidia) sont tous open-source ou accessibles via API, ce qui renforce la reproductibilité. Dans le paysage actuel où Figure (Figure 03), Tesla (Optimus), Physical Intelligence (pi0) et Boston Dynamics investissent massivement dans les pipelines de manipulation apprise, cette approche modulaire et frugale en données offre une alternative pragmatique, notamment pour les déploiements pilotes dans des cellules de production à faible volume ou à variété élevée d'objets.

UELes intégrateurs robotiques et PME industrielles européens peuvent évaluer et reproduire ce pipeline open-source (Roboflow, Meta SAM 3D, FoundationPose) pour réduire drastiquement le time-to-deployment sur des cellules de production à haute variété d'objets, sans équipement spécialisé ni équipe robotique dédiée.

IA physiquePaper
1 source
Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain
97Le Big Data 

Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain

Un robot humanoïde du fabricant chinois Honor a bouclé un semi-marathon à Pékin en 50 minutes et 26 secondes, surpassant le record humain de la discipline détenu par l'athlète ougandais Jacob Kiplimo. Surnommé "Lightning", ce robot aux jambes de 95 centimètres a reproduit une foulée longue et efficace, proche de celle des athlètes professionnels. Honor n'a pas engagé un seul robot dans cette course, mais trois, signalant une stratégie industrielle assumée plutôt qu'un simple coup de communication. Parmi les plus de 100 robots humanoïdes présents sur la ligne de départ, près de la moitié ont franchi l'arrivée sans aucune assistance humaine directe, analysant leur environnement en temps réel et ajustant leur trajectoire de manière autonome. Ce résultat marque un saut qualitatif net par rapport à l'édition précédente, où beaucoup de robots abandonnaient en chemin, perdaient l'équilibre ou s'immobilisaient en plein effort. En 2026, les machines tiennent la distance, accélèrent, et certaines dépassent des coureurs professionnels sur plusieurs segments. Le chiffre le plus révélateur n'est pas le chrono, mais la croissance du nombre de participants : d'une vingtaine de robots l'an dernier à plus de 100 cette année. Ce que démontre Honor, c'est la capacité à faire sortir des technologies grand public, développées à l'origine pour les smartphones, vers des machines capables de performances physiques comparables à celles d'un humain entraîné. Pour l'industrie robotique mondiale, c'est la preuve que l'endurance et l'autonomie de déplacement en milieu réel ne sont plus des obstacles théoriques. La Chine investit massivement dans la robotique humanoïde depuis plusieurs années, portée par une volonté politique de dominer ce secteur jugé stratégique, au même titre que les semi-conducteurs ou l'intelligence artificielle. Des entreprises comme Unitree, Fourier Intelligence ou désormais Honor s'imposent dans un marché mondial où Boston Dynamics et Tesla (avec Optimus) font figure de références. Le semi-marathon de Pékin fonctionne comme un banc d'essai public : les robots y affrontent des conditions réelles, imprévisibles, face à des milliers de coureurs humains. Chaque édition sert à mesurer les progrès effectifs, loin des démonstrations contrôlées en laboratoire. La prochaine étape logique sera de voir ces systèmes opérer dans des environnements industriels ou de service, où la robustesse et l'autonomie comptent autant que la vitesse. La course au semi-marathon n'est qu'un indicateur parmi d'autres d'une compétition technologique beaucoup plus large qui ne fait que commencer.

UELa montée en puissance de la Chine dans la robotique humanoïde, illustrée par Honor, Unitree et Fourier, représente un défi stratégique direct pour l'industrie européenne, qui accuse un retard croissant face à des acteurs soutenus par une volonté politique nationale forte.

Des robots humanoïdes franchissent le cap d'une heure au semi-marathon, réduisant rapidement l'écart avec les humains
98Pandaily 

Des robots humanoïdes franchissent le cap d'une heure au semi-marathon, réduisant rapidement l'écart avec les humains

Le 19 avril 2026, au semi-marathon de Beijing E-Town, le robot humanoïde "Lightning" développé par Honor a remporté la division robotique avec un temps net de 50 minutes et 26 secondes, soit environ 17 minutes de mieux que le meilleur coureur humain de l'épreuve, crédité d'un temps compris entre 1h07 et 1h08. Les deuxième et troisième places sont revenues aux équipes Leiting Shandian (50:56) et Xinghuo Liaoyuan (53:01), les trois robots ayant complété le parcours en navigation entièrement autonome et sous la barre des 60 minutes. Plus de 100 équipes et environ 300 robots, chinois et étrangers, se sont alignés sur les 21,0975 km d'un tracé intégrant dénivelés, virages à quasi-90 degrés et plus de dix types de terrain différents. Parmi les participants figuraient notamment le "Tien Kung Ultra" du Beijing Innovation Center of Humanoid Robotics et le H1 d'Unitree. L'an passé, le robot vainqueur avait mis 2h40 pour boucler le même type d'épreuve : le bond de performance est donc considérable, même si les conditions exactes de comparaison entre éditions restent à préciser. Ce résultat est significatif au-delà du symbole sportif. Que des robots en navigation autonome, sans téléopération, tiennent un rythme supérieur à celui du meilleur humain du jour sur un semi-marathon en conditions réelles constitue une validation système difficile à ignorer pour les intégrateurs industriels : planification de trajectoire, équilibre dynamique, dissipation thermique et endurance mécanique ont été testés simultanément, sur 21 km, en extérieur. Liu Xingliang, directeur du DCCI Internet Research Institute, identifie trois transitions en cours dans le secteur : passage du contrôle distant à l'autonomie, des laboratoires à la fiabilité d'ingénierie, et des technologies isolées vers des architectures perception-décision-contrôle intégrées. La course illustre concrètement ces trois axes. Elle tend aussi à réduire l'argument du "demo gap" : les robots n'ont pas performé dans un environnement contrôlé mais sur un parcours public, avec terrain variable et forte sollicitation thermique. Honor est entré dans la robotique humanoïde il y a moins de deux ans, via son unité d'incubation industrielle, avec des équipes couvrant les mains dextres, le software système, les algorithmes d'IA embodied et l'ingénierie de test. Lightning embarque un système de refroidissement liquide maison, des capillaires traversant les moteurs, avec une pompe haute pression circulant plus de 4 litres de liquide caloporteur par minute, et des modules d'articulation intégrés atteignant un couple crête de 400 Nm. Lens Technology, fournisseur historique de composants structurels métalliques pour smartphones, a livré plus de 130 pièces de structure pour le robot, signe que la supply chain de l'électronique grand public s'oriente activement vers la robotique. Face à Honor, les acteurs établis comme Unitree et le Beijing Innovation Center of Humanoid Robotics restent en lice, tandis qu'à l'international, Figure, Agility Robotics ou 1X Technologies n'ont pas encore exposé leurs plateformes à des épreuves d'endurance comparables en conditions réelles ouvertes. La prochaine étape pour Honor n'a pas été annoncée officiellement, mais le positionnement robotique s'inscrit clairement dans sa stratégie IA et écosystème device.

UEL'avance prise par les acteurs chinois en endurance autonome en conditions réelles accentue le retard compétitif des acteurs européens et français du secteur humanoïde, sans impact réglementaire ou commercial direct à court terme.

JD.com Launches “Robot Ambulance” Service, Targets 50 Cities in Three Years
99Pandaily 

JD.com Launches “Robot Ambulance” Service, Targets 50 Cities in Three Years

JD.com, le géant chinois du e-commerce, a lancé officiellement son service baptisé "robot ambulance", un réseau de maintenance et de réparation dédié aux robots commerciaux. Le service couvre les robots humanoïdes, quadrupèdes et robots compagnons IA, et propose une gamme complète de prestations : diagnostics de pannes, remplacement de batteries, tests de performance, maintenance esthétique et recyclage d'équipements. Déjà opérationnel à Pékin, le dispositif doit s'étendre à plus de 50 grandes villes chinoises d'ici trois ans. JD.com vise également une expansion internationale vers l'Europe, l'Amérique du Nord, le Moyen-Orient et l'Asie-Pacifique, avec des opérations déjà amorcées dans certains pays européens. Pour soutenir cette croissance, l'entreprise s'est fixé l'objectif de recruter plus de 10 000 ingénieurs spécialisés en robotique sur la même période. Ce lancement signale une mutation structurelle dans l'industrie robotique chinoise : le marché ne se limite plus à la fabrication et à la vente de robots, il génère désormais une demande de services après-vente à l'échelle industrielle. Pour les intégrateurs et les opérateurs B2B qui déploient des flottes humanoïdes ou quadrupèdes, l'absence d'infrastructure de maintenance fiable reste l'un des principaux freins à l'adoption. En positionnant une offre de service centralisée et multi-marques, JD.com comble un vide réel, tout en consolidant sa position de plateforme logistique dans l'écosystème robot. C'est aussi un signal que le volume de robots déployés en conditions réelles est désormais suffisant pour justifier une économie de la maintenance. JD.com n'est pas un acteur robotique au sens strict : c'est un opérateur logistique qui utilise des robots dans ses propres entrepôts depuis des années, et qui capitalise maintenant sur cette expertise opérationnelle pour en faire un service tiers. Les partenariats annoncés avec Unitree Robotics, Songyan Dynamics, Deep Robotics et AGIBOT, tous des acteurs majeurs du marché humanoïde et quadrupède chinois, donnent au service une couverture multi-constructeurs crédible. Aucun équivalent de cette échelle n'existe à ce jour en Europe, où des acteurs comme Enchanted Tools ou Wandercraft opèrent encore sans réseau de service structuré. La prochaine étape déclarée est l'extension internationale, dont le calendrier précis reste à confirmer.

UEJD.com ayant déjà amorcé des opérations dans certains pays européens, ce service crée une pression compétitive sur les intégrateurs européens et signale un vide structurel dans l'offre de maintenance de flottes robotiques en Europe.

Agibot livre son 10 000e robot humanoïde produit en série
100The Information AI 

Agibot livre son 10 000e robot humanoïde produit en série

Agibot, startup chinoise spécialisée dans les robots humanoïdes et basée à Shanghai, a annoncé ce lundi avoir produit sa 10 000e unité en série. Cette étape symbolique intervient seulement trois mois après que l'entreprise avait annoncé la sortie de son 5 000e robot — ce qui signifie qu'Agibot a doublé son volume de production en moins d'un trimestre, un rythme industriel sans précédent dans ce secteur. Cette cadence illustre la montée en puissance de la robotique humanoïde à grande échelle, jusqu'ici considérée comme un horizon lointain. Atteindre 10 000 unités en production de masse positionne Agibot comme un acteur capable de livrer des robots à des clients industriels à des volumes réellement opérationnels — ce que ni Boston Dynamics ni Figure n'ont encore atteint publiquement. Cela crée une pression directe sur les concurrents occidentaux. Cette accélération s'inscrit dans une course technologique et industrielle que Pékin soutient activement, avec des subventions ciblées sur la robotique humanoïde identifiée comme secteur stratégique. Agibot, fondée en 2023, bénéficie de cette dynamique aux côtés d'autres acteurs chinois comme Unitree ou Fourier Intelligence. La question qui se pose désormais est celle du déploiement réel : dans quelles usines, à quels coûts, et avec quelle fiabilité ces 10 000 robots seront-ils mis au travail.

UELa montée en puissance industrielle de la robotique humanoïde chinoise, soutenue par Pékin, accentue le retard des industriels européens et crée une pression concurrentielle directe sur les filières d'automatisation en France et en UE.

HumanoïdesActu
1 source