Aller au contenu principal

Dossier Agility Robotics — Digit

267 articles

Agility Robotics et Digit : déploiement entrepôts (Amazon, GXO, Spanx), focus pick-and-place, levée de fonds et batailles juridiques.

Sommet en robotique : un panel fait le point sur la conception des robots humanoïdes
1Robotics Business Review HumanoïdesActu

Sommet en robotique : un panel fait le point sur la conception des robots humanoïdes

Lors du Robotics Summit & Expo 2026, tenu à Boston au Thomas B. Menino Convention & Exhibition Center devant quelque 3 900 participants, un panel de haut niveau a fait le point sur l'état réel du développement des robots humanoïdes. Alberto Rodriguez, directeur du comportement robot pour Atlas chez Boston Dynamics, y a révélé que l'entreprise a engagé le déploiement de l'ordre de 25 000 humanoïdes Atlas dans des usines, avec un objectif de capacité de production portée à 30 000 unités par an d'ici 2028. Boston Dynamics a conduit une première démonstration en conditions réelles en usine en 2025, architecture entièrement pilotée par les données, puis a présenté Atlas au CES de janvier 2026 pendant une semaine complète. Pour 2026, la société prévoit un retour en usine pour une démonstration plus complète, de bout en bout, connectant le robot au système d'information de l'usine et gérant les exceptions opérationnelles. Du côté d'Agility, dont la marque commerciale s'est récemment stabilisée sous le nom Agility (ex-Agility Robotics), les déploiements du robot Digit avancent avec Amazon, GXO, Schaeffler, Toyota et Mercado Libre, marquant une sortie effective de la phase pilote. Ce que ce panel signale clairement pour les intégrateurs et décideurs industriels, c'est que le vrai verrou n'est plus mécanique ni même algorithmique, mais stratégique. Rodriguez a posé le problème avec précision : sauf pour de rares applications à très grand volume et très stable, presque tous les postes de travail sont des cas uniques. Le défi du passage à l'échelle repose sur trois axes simultanés, hardware, modèles de comportement, et stratégie d'intégration, et l'échec sur l'un suffit à rendre le déploiement économiquement non viable. La décision de Boston Dynamics de commencer par la logistique en manufacturing, un environnement qui exige de la généralité sans imposer encore les contraintes de timing et de sécurité de la ligne d'assemblage, illustre une approche pragmatique et graduée. Ces chiffres de déploiement engagés, 25 000 unités, sont une donnée de marché rare dans un secteur habitué aux annonces sans livraisons. Boston Dynamics, filiale de Hyundai depuis 2021, a traversé une longue période de recherche pure avant de commercialiser Atlas dans sa version électrique présentée en 2024, succédant aux plateformes hydrauliques historiques. Le marché des humanoïdes reste en pleine effervescence : Figure AI avec Figure 03, Tesla avec Optimus Gen 3 sur sa propre ligne de production, Physical Intelligence avec Pi-0, NVIDIA avec GR00T N2, et des acteurs émergents comme 1X Technologies ou Apptronik positionnent tous leurs solutions sur des créneaux différents, de l'assemblage léger à la manutention lourde. Côté Europe, Enchanted Tools (France) et Wandercraft restent focalisés sur des niches spécifiques, assistance et rééducation, sans viser encore le marché industriel général. Les prochaines étapes à surveiller : la publication par ASTM International (représenté dans le panel par Aaron Prather) de standards de sécurité pour la cohabitation humains-humanoïdes, et les résultats concrets des déploiements Agility/Amazon, dont les métriques opérationnelles restent pour l'instant non publiques.

UELes entreprises françaises (Enchanted Tools, Wandercraft) restent cantonnées aux niches assistance/rééducation sans feuille de route vers l'industriel général, creusant un écart stratégique avec les déploiements à grande échelle désormais en cours en Amérique du Nord.

1 source
Un robot humanoïde coréen exécute une danse K-POP virale apprise en regardant des vidéos
2Interesting Engineering 

Un robot humanoïde coréen exécute une danse K-POP virale apprise en regardant des vidéos

ROBOTIS, fabricant coréen de composants et plateformes robotiques, a publié début juin 2026 une démonstration de son humanoïde AI Sapiens reproduisant le "CORTIS REDRED Challenge", une chorégraphie K-POP virale, à partir d'une unique vidéo captée sur smartphone. La chaîne de traitement repose sur quatre étapes enchaînées : capture de mouvement vidéo, retargeting cinématique vers la morphologie du robot, entraînement par apprentissage par renforcement en simulation, puis transfert Sim2Real vers le matériel physique. Aucun système de motion capture professionnel (OptiTrack, Vicon) n'a été utilisé. AI Sapiens mesure 1,3 mètre pour 34 kilogrammes, dispose de 23 degrés de liberté assurés par 23 actionneurs DYNAMIXEL-Q quasi-direct-drive (14 QM-060 et 9 QM-080), et embarque un NVIDIA Jetson Orin NX 16 Go offrant jusqu'à 100 TOPS de puissance de calcul. L'alimentation est assurée par une batterie 46,8 V, 9 000 mAh. ROBOTIS prévoit de publier l'intégralité du pipeline en open-source, incluant les fichiers CAD, le code source, les assets de simulation et les tutoriels. Ce qui mérite attention, ce n'est pas la danse en elle-même -- les vidéos de robots qui dansent sont devenues un genre communicationnel à part entière -- mais la suppression du goulot d'étranglement de la collecte de données de mouvement. Jusqu'ici, entraîner un humanoïde sur des mouvements complexes requérait des studios de capture équipés et des techniciens spécialisés, coûts prohibitifs pour les équipes de recherche et les PME industrielles. Substituer cela à une vidéo smartphone abaisse drastiquement la barrière d'entrée pour la production de comportements moteurs variés. La démonstration valide aussi partiellement le pipeline Sim2Real comme suffisamment robuste pour des mouvements dynamiques à corps entier -- un point que beaucoup d'équipes considéraient encore fragile hors de contextes très contraints. Reste que la vidéo présente un mouvement expressif non critique : il faudra des preuves comparables sur des tâches à charge utile ou à contact riche pour juger de la généralisation réelle de la méthode. ROBOTIS est une entreprise coréenne historiquement centrée sur les actionneurs Dynamixel, composants de référence dans la robotique académique mondiale depuis les années 2000. AI Sapiens constitue sa montée en gamme vers les plateformes humanoides complètes, en compétition directe avec des systèmes comme Unitree H1/G1 (Chine), Agility Robotics Digit (USA) ou Sanctuary AI Phoenix (Canada), tous également positionnés sur l'open-source partiel ou la recherche collaborative. Dans le paysage européen, des acteurs comme Enchanted Tools (Mirokaï, France) ou Wandercraft (exosquelette, Paris) restent sur des segments plus spécialisés. La publication open-source annoncée par ROBOTIS est un pari sur l'effet de communauté : si le pipeline se diffuse dans les labos universitaires, ROBOTIS consolide son écosystème Dynamixel comme standard de facto pour la prochaine génération d'humanoides de recherche. Aucune date de release précise n'a été communiquée à ce stade.

UELes laboratoires de recherche européens utilisant des actionneurs Dynamixel (standard académique mondial) pourront potentiellement bénéficier de la publication open-source du pipeline vidéo-vers-mouvement, réduisant le coût d'entrée pour l'entraînement de comportements moteurs complexes sans équipement de capture de mouvement professionnel.

HumanoïdesPaper
1 source
SCALE : observation et exécution adaptatives guidées par l'auto-incertitude dans les modèles VLA
3arXiv cs.RO 

SCALE : observation et exécution adaptatives guidées par l'auto-incertitude dans les modèles VLA

Une équipe de chercheurs propose SCALE (Self-uncertainty Conditioned Adaptive Looking and Execution), une méthode d'inférence adaptative pour les modèles Vision-Language-Action (VLA) publiée sur arXiv (2602.04208v2). Contrairement aux approches de test-time scaling (TTS) existantes, SCALE ne nécessite ni entraînement supplémentaire, ni vérificateur externe, ni passes multiples : un seul passage forward suffit. Le système repose sur un mécanisme de self-uncertainty (auto-incertitude) qui module simultanément deux dimensions : la représentation visuelle, c'est-à-dire comment le modèle perçoit la scène, et l'action produite. Inspiré de la théorie de l'inférence active (Active Inference), SCALE élargit son exploration perceptuelle et motrice en situation d'incertitude élevée, et se concentre sur l'exploitation lorsque la confiance est forte. Les auteurs valident l'approche sur des benchmarks simulés et réels, avec des gains mesurés sur plusieurs VLA de l'état de l'art. L'intérêt industriel est direct. Les méthodes TTS existantes pour robots empruntent leur logique aux succès des LLM comme o1, mais exigent des ressources difficilement compatibles avec la production : vérificateurs externes, passes multiples, parfois fine-tuning ciblé. SCALE lève ce verrou en maintenant l'efficacité d'un passage unique, compatible avec des contraintes de temps réel sur systèmes embarqués. Plus structurellement, la méthode adresse un angle souvent ignoré par les approches concurrentes : l'ambiguïté perceptuelle. En conditions réelles, un robot confronté à une scène mal éclairée ou partiellement occultée a autant besoin de reconsidérer sa perception que son action. SCALE couple ces deux dimensions, là où les TTS classiques n'interviennent qu'au niveau du décodage d'action -- une distinction qui compte dès que l'on sort des environnements contrôlés de laboratoire. Le test-time scaling appliqué à la robotique reste un champ en construction. Des modèles comme Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) ou OpenVLA visent à généraliser le contrôle robotique via des architectures VLA, mais leur robustesse hors distribution est un problème ouvert. La plupart des améliorations passent encore par du fine-tuning ; SCALE propose une voie alternative en améliorant le comportement à l'inférence sans toucher aux poids du modèle. L'article ne documente pas encore de déploiements industriels à grande échelle, et les benchmarks utilisés restent des environnements relativement balisés. Si la robustesse se confirme dans des configurations non contrôlées, la méthode pourrait s'intégrer comme composant standard dans les pipelines VLA déployés par des acteurs comme Figure AI, Agility Robotics ou 1X Technologies.

IA physiqueOpinion
1 source
GenHOI : interaction humanoïde-objet sensible aux contacts par imitation de vidéos générées, sans entraînement spécifique
4arXiv cs.RO 

GenHOI : interaction humanoïde-objet sensible aux contacts par imitation de vidéos générées, sans entraînement spécifique

Une équipe de chercheurs propose GenHOI (arXiv:2606.12995, juin 2026), un cadre logiciel permettant à des robots humanoïdes d'interagir avec des objets variés en mode zéro-shot, sans entraînement spécifique à la tâche ni données de démonstration physique. Le système prend en entrée une commande en langage naturel et une image du premier plan de la scène robot-objet reconstruite en simulation, à partir desquels un modèle génératif produit une vidéo d'interaction synthétique orientée tâche. Cette vidéo est analysée pour identifier les événements de contact pertinents et estimer les régions de contact main-objet, encodés sous forme de contraintes géométriques centrées sur l'objet. Ces contraintes servent de priors d'optimisation pour raffiner la trajectoire de référence extraite de la vidéo 2D, résolvant l'ambiguïté d'échelle inhérente à la génération vidéo, et adaptent une trajectoire unique à des poses relatives robot-objet non vues à l'entraînement. Un contrôleur de suivi en boucle fermée assure l'exécution finale. Les tâches validées en simulation et en réel incluent la saisie de boîtes, le transport bimanuel asymétrique d'une chaise, le soulèvement d'une table par en-dessous et l'enveloppement d'objets cylindriques. Il s'agit d'un preprint académique, pas d'un produit déployé. L'enjeu central est la rupture avec le paradigme d'entraînement par tâche, principal goulot d'étranglement du déploiement industriel des humanoïdes. Les approches existantes exigent soit des centaines d'heures de collecte de démonstrations physiques par tâche, soit rejouent des trajectoires rigides incapables de s'adapter à des variations de pose ou d'objet. GenHOI contourne ces deux limites en substituant la génération vidéo à la démonstration réelle, tout en maintenant une conscience physique du contact via des contraintes géométriques explicites. La capacité d'adaptation à des configurations inédites robot-objet sans réentraînement est particulièrement significative pour les intégrateurs industriels devant déployer rapidement un humanoïde sur de nouvelles références produit. La problématique de l'interaction humanoïde-objet est activement travaillée par plusieurs acteurs concurrents : Physical Intelligence avec Pi-0, NVIDIA avec GR00T N2, et les équipes de Figure AI ou Boston Dynamics opèrent dans un espace voisin, mais s'appuient majoritairement sur du fine-tuning tâche par tâche ou du reinforcement learning avec simulateurs massivement parallèles. GenHOI se positionne comme une approche complémentaire, plus légère en données, exploitant la capacité des générateurs vidéo récents à produire des séquences physiquement plausibles. La principale limite non adressée est la robustesse à l'échelle sur des centaines de tâches distinctes et la gestion des objets déformables. Les prochaines étapes naturelles seraient une évaluation sur des plateformes commerciales comme l'Unitree G1 ou l'Agility Digit, et une intégration avec des policies de bas niveau plus génériques.

IA physiqueOpinion
1 source
L'architecture du critique est cruciale : critiques doubles ou unifiés pour la loco-manipulation des humanoïdes
5arXiv cs.RO 

L'architecture du critique est cruciale : critiques doubles ou unifiés pour la loco-manipulation des humanoïdes

Une étude publiée sur arXiv le 11 juin 2026 (réf. 2606.11891) présente une comparaison rigoureuse de deux architectures de critique en apprentissage par renforcement multi-objectifs pour robots humanoïdes : un critique unifié (un seul réseau estimant la valeur combinée de tous les objectifs) contre des critiques duaux (deux réseaux distincts, chacun associé à un signal de récompense séparé, l'un pour la locomotion, l'autre pour la manipulation). Les expériences ont été conduites sur le Unitree G1, un humanoïde à 23 degrés de liberté actifs, dans le simulateur NVIDIA Isaac Lab, via un curriculum séquentiel de 13 niveaux progressant de l'atteinte stationnaire jusqu'à la marche avec des cibles à orientation variable. Résultat : les politiques entraînées avec critiques duaux atteignent leurs cibles 3,5 fois plus vite (6,5 pas de simulation contre 22,6), affichent un débit deux fois supérieur (14,3 contre 7,0 atteintes validées pour 1 000 pas), et un taux de réussite validé de 65,2 % contre 53,8 % pour le critique unifié. Ce que l'étude démontre, c'est que le choix de l'architecture du critique est un levier de conception primaire, souvent négligé, dont l'impact surpasse celui du reward engineering. Fait notable : l'ajout de mécanismes anti-gaming, conçus pour empêcher la politique d'exploiter les failles de la fonction de récompense, ne produit aucun gain au-delà du changement architectural seul (60,9 % contre 65,2 %). L'implication la plus immédiate concerne le fine-tuning RL de politiques pré-entraînées par imitation : lorsqu'on affine un modèle de manipulation déjà appris (style Pi-0 ou GR00T N2), un critique unifié risque de supprimer les comportements acquis par interférence des gradients de locomotion. Pour les équipes qui cherchent à spécialiser des modèles de fondation robotiques par RL, cette mise en garde est directement opérationnelle. Le Unitree G1, vendu autour de 16 000 dollars, est devenu un banc de test standard pour la recherche en humanoïde abordable, face aux plateformes de Figure AI, Agility Robotics ou 1X Technologies qui opèrent sur des gammes de prix bien supérieures. NVIDIA Isaac Lab, successeur d'Isaac Gym, s'est imposé comme l'environnement de référence pour l'entraînement sim-to-real. La question du découplage locomotion/manipulation en RL multi-objectifs est au coeur de plusieurs groupes de recherche (Stanford, CMU, ETH Zurich), et les résultats de cette étude, issus d'un cadre contrôlé et reproductible, offrent une base solide pour orienter les choix d'architecture avant tout entraînement coûteux sur robot réel.

RecherchePaper
1 source
Main dextérique modulaire et anthropomorphique : conception par analyse comparative multi-paramètres des doigts
6arXiv cs.RO 

Main dextérique modulaire et anthropomorphique : conception par analyse comparative multi-paramètres des doigts

Des chercheurs ont publié en juin 2026 sur arXiv (arXiv:2606.11826) un framework de conception pour mains robotiques anthropomorphiques dextres, fondé sur une approche modulaire de sélection des doigts. Le principe : évaluer quantitativement des prototypes de doigts de manière indépendante, via une batterie de benchmarks, avant leur intégration dans une main complète téléopérée. Les variations testées portent sur le type d'articulation, la structure osseuse, les matériaux de peau et le placement des capteurs. Le framework a été validé sur deux tâches concrètes : la saisie simultanée de plusieurs objets et le vissage d'une ampoule, deux exercices représentatifs de la manipulation dextre à contraintes mécaniques variables. Ce travail s'attaque à un verrou structurel du domaine : la conception de mains dextres souffre d'un espace de design trop vaste, où morphologie, actuation et capteurs interagissent de façon non-linéaire. Les méthodes d'optimisation existantes traitent rarement plus d'un critère à la fois, ce qui rend les comparaisons inter-prototypes difficiles et les itérations coûteuses. En découplant l'optimisation des doigts de la validation au niveau de la main entière, le framework proposé réduit potentiellement le temps de screening et établit un lien quantitatif entre les métriques composant et la performance globale en tâche. Pour les équipes d'ingénierie et les intégrateurs, c'est une promesse de pipeline de développement plus prédictif, moins dépendant de l'empirisme. À noter : l'article est un preprint arXiv, sans peer review encore validé, et les gains de performance sur les deux tâches choisies restent difficiles à extrapoler à des scénarios industriels réels. La conception de mains dextres est un enjeu central pour les robots humanoïdes actuels : Figure AI, 1X, Apptronik, et Agility Robotics dépendent toutes de mains capables d'alimenter des pipelines de téléopération et d'apprentissage par imitation pour entraîner des modèles VLA. Côté académique, des groupes à Stanford, CMU et au MIT travaillent sur des architectures similaires, tandis que Shadow Robotics (UK) reste la référence commerciale en matière de main dextre à actuation tendon. En Europe, Pollen Robotics (Bordeaux) intègre des mains articulées dans sa plateforme Reachy, et Enchanted Tools (Paris) développe des mains expressives pour ses robots Miroka. Ce preprint ne s'accompagne pas d'annonce commerciale ni de calendrier de déploiement, mais la méthodologie de benchmarking modulaire pourrait être adoptée comme standard de facto dans les équipes hardware des startups d'humanoïdes, où la vitesse d'itération sur les effecteurs est aujourd'hui un facteur différenciant clé.

UEPollen Robotics (Bordeaux) et Enchanted Tools (Paris) sont directement mentionnés comme bénéficiaires potentiels de cette méthodologie de benchmarking modulaire, qui pourrait accélérer leurs cycles d'itération sur les effecteurs.

RecherchePaper
1 source
NEURA ROBOTICS lève 1,2 milliard d’euros : la robotique devient le nouveau pari stratégique de l’Europe
7FrenchWeb 

NEURA ROBOTICS lève 1,2 milliard d’euros : la robotique devient le nouveau pari stratégique de l’Europe

Neura Robotics, startup allemande spécialisée dans la robotique humanoïde, vient d'annoncer une levée de fonds de 1,4 milliard de dollars, soit environ 1,2 milliard d'euros, portant sa valorisation à près de 6 milliards d'euros. L'opération regroupe un consortium d'investisseurs aussi large qu'inédit : Amazon, NVIDIA et Qualcomm côté tech, Bosch et Schaeffler côté industrie allemande, la Banque européenne d'investissement comme acteur public, auxquels s'ajoutent plusieurs fonds financiers internationaux. Il s'agit du plus grand tour de financement jamais réalisé pour une entreprise européenne de robotique. Ce signal dépasse la simple performance financière. La présence simultanée de géants technologiques américains, de champions industriels allemands et d'une institution publique européenne traduit une convergence rare : le robot humanoïde n'est plus un projet de laboratoire, il devient une infrastructure industrielle crédible. Pour Amazon, qui déploie déjà des robots dans ses entrepôts, l'enjeu est d'intégrer des machines capables de remplacer la main humaine dans les tâches non automatisées. Pour NVIDIA et Qualcomm, c'est un débouché majeur pour leurs puces d'IA embarquée. Fondée par David Reger, Neura Robotics s'inscrit dans une course mondiale qui oppose désormais les Américains Figure AI, Agility Robotics et Boston Dynamics aux acteurs chinois en pleine montée en puissance. L'Europe, longtemps absente de ce segment, tente d'y placer un champion. Ce financement donne à Neura les moyens d'accélérer la production et de conquérir des clients industriels avant que la fenêtre de leadership ne se referme.

UEUne startup allemande lève 1,2 milliard d'euros avec le soutien de la Banque européenne d'investissement et des industriels allemands Bosch et Schaeffler, positionnant l'Europe comme acteur crédible dans la course mondiale aux robots humanoïdes industriels.

💬 La liste des investisseurs dit tout : Amazon, NVIDIA, Bosch et la BEI dans le même tour, ça ne ressemble plus à un pari de VC, ça ressemble à une infrastructure qui se construit. L'Europe avait besoin d'un champion dans cette course aux humanoïdes, Neura pourrait être lui, bon, sur le papier du moins. Reste à voir si 1,2 milliard suffit à tenir le rythme face aux acteurs américains et chinois qui n'ont pas attendu.

HumanoïdesOpinion
1 source
NEURA Robotics lève jusqu'à 1,4 milliard de dollars en Série C pour son IA physique
8Robotics Business Review 

NEURA Robotics lève jusqu'à 1,4 milliard de dollars en Série C pour son IA physique

NEURA Robotics GmbH, basée à Metzingen en Allemagne, a annoncé le 10 juin 2026 une levée de fonds de Série C pouvant atteindre 1,4 milliard de dollars, financée par un consortium d'investisseurs technologiques dont Tether, Qualcomm et Amazon. La startup, fondée en 2019 par David Reger, commercialise une gamme couvrant des bras robotiques légers, des robots mobiles (série MAV), des robots humanoïdes (modèle 4NE1) et un manipulateur mobile polyvalent baptisé MiPA, ciblant principalement la fabrication et la supply chain. Ce tour de table vient financer deux axes prioritaires : le développement de la plateforme "Neuraverse", décrite comme un écosystème ouvert d'IA physique permettant aux robots d'apprendre collectivement entre déploiements, et l'expansion d'un réseau mondial de "NEURA Gyms", des environnements d'entraînement à grande échelle combinant interaction sensorielle réelle, simulation et pipelines d'apprentissage multimodal. Il s'agit à ce stade d'une annonce de financement, pas d'un produit expédié ni d'un déploiement industriel documenté à grande échelle. Sur le fond, une levée de 1,4 milliard de dollars pour un acteur européen de la robotique humanoïde est un signal fort : les capitaux qui se concentraient jusqu'ici quasi exclusivement sur Figure AI, Agility Robotics, 1X ou Tesla Optimus commencent à irriguer des challengers hors Silicon Valley. Pour les intégrateurs et les décideurs industriels, la question concrète est celle du sim-to-real gap, que NEURA tente de réduire via son partenariat avec Dassault Systèmes annoncé en avril 2026. Le concept de Neuraverse, où plusieurs robots partagent une intelligence distribuée entre déploiements, s'inscrit dans une tendance plus large des architectures VLA (Vision-Language-Action) à l'échelle fleet, comme l'illustre Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. Les métriques de performance annoncées restent cependant absentes du communiqué, ce qui rend toute comparaison technique avec les concurrents impossible à ce stade. NEURA Robotics a bâti depuis 2019 un réseau de partenaires industriels structurant : Bosch pour le développement logiciel des humanoïdes (janvier 2026), Dassault Systèmes pour la simulation, mais aussi Schaeffler, Kawasaki, Delta Electronics, Qualcomm et NVIDIA pour l'infrastructure edge AI et les composants. Ce positionnement d'écosystème décentralisé tranche avec l'approche verticalement intégrée de Figure ou de Tesla. En Europe, NEURA est aujourd'hui l'acteur humanoïde le mieux capitalisé, loin devant des startups comme Enchanted Tools (France) ou Wandercraft, qui opèrent sur des segments différents (cobots expressifs et exosquelettes médicaux). Les prochaines étapes déclarées portent sur l'accélération du déploiement à l'échelle industrielle et l'ouverture de nouveaux NEURA Gyms à l'international, sans calendrier précis communiqué.

UENEURA Robotics, acteur allemand désormais le humanoïde le mieux capitalisé d'Europe avec 1,4 Md$, implique directement Dassault Systèmes (France) comme partenaire stratégique simulation et repositionne l'UE comme concurrent crédible face aux leaders américains de la robotique humanoïde industrielle.

FR/EU ecosystemeOpinion
1 source
Tye Brady (Amazon) : les robots du futur « se fondront dans le décor »
9La Tribune 

Tye Brady (Amazon) : les robots du futur « se fondront dans le décor »

Tye Brady, directeur technologique d'Amazon Robotics, a dévoilé les grandes ambitions d'Amazon en matière d'automatisation lors d'une récente intervention publique. L'entreprise opère déjà une flotte de plus d'un million de robots dans ses centres logistiques à travers le monde, et a annoncé un investissement de 10 milliards d'euros pour moderniser ses entrepôts européens dans les années à venir. L'objectif affiché : élargir considérablement le champ d'action de ces machines, notamment en les dotant d'une capacité de compréhension du langage naturel. Cette évolution représente un saut qualitatif majeur pour l'industrie logistique. Des robots capables de comprendre des instructions en langage courant, et non plus seulement des commandes codées, pourraient opérer de manière bien plus autonome et flexible aux côtés des travailleurs humains. Pour Amazon, cela signifie une réduction des coûts opérationnels à grande échelle, mais aussi une pression accrue sur l'emploi dans des secteurs déjà fragilisés par l'automatisation. Brady résume la vision par une formule : les robots du futur « se fondront dans le décor », discrets et omniprésents à la fois. Amazon n'est pas seul sur ce terrain : des acteurs comme Boston Dynamics, Figure ou Agility Robotics développent des robots humanoïdes visant les mêmes environnements industriels. L'intégration du traitement du langage naturel dans la robotique, rendue possible par les avancées des grands modèles de langage, est devenue l'enjeu central de la prochaine génération de systèmes automatisés. L'investissement européen d'Amazon s'inscrit dans ce contexte de course technologique, avec des implications réglementaires et sociales que Bruxelles commencera sans doute à encadrer plus fermement.

UEAmazon investit 10 milliards d'euros dans la modernisation de ses entrepôts européens, avec des implications directes sur l'emploi dans la logistique en France et des pressions réglementaires croissantes pour Bruxelles.

💬 Un million de robots déjà en prod, et là ils annoncent qu'ils veulent qu'ils comprennent le langage naturel, comme si c'était juste le prochain patch. C'est la bascule qui rend le reste sérieux : des robots qui s'adaptent aux instructions humaines au lieu de forcer les humains à s'adapter aux robots. Les 10 milliards en Europe, c'est pas de la com, c'est la mise de départ d'une course où Bruxelles va très vite devoir choisir entre réguler et regarder.

HumanoïdesOpinion
1 source
Vulnérabilités des modèles vision-langage-action (VLA) face aux défauts physiques d'articulation
10arXiv cs.RO 

Vulnérabilités des modèles vision-langage-action (VLA) face aux défauts physiques d'articulation

Des chercheurs ont publié le 10 juin 2026 (arXiv:2606.10501) une étude identifiant une vulnérabilité critique des modèles Vision-Language-Action (VLA) face aux défauts physiques articulaires. Ces modèles, qui traduisent instructions en langage naturel et observations visuelles en commandes motrices, équipent aujourd'hui les robots humanoïdes et manipulateurs les plus avancés. Les auteurs montrent que des failles réalistes, notamment dégradation d'actionneur, friction excessive due à l'usure, dommages de collision ou limites de sécurité restreintes, cassent la boucle fermée entre action commandée, mouvement réalisé et observation suivante, dégradant les taux de succès même pour des défauts physiquement « faisables ». L'impact varie selon l'articulation affectée, rendant toute mitigation générique difficile. En réponse, les auteurs proposent J-PARC (Joint-level Physical-fault Aware Residual Calibrator), un module léger ajouté au-dessus d'une politique VLA figée, qui infère un régime de défaut latent depuis la dynamique articulaire récente et applique une correction résiduelle adaptative sans modifier le modèle de base. Ce résultat comble un angle mort réel dans la validation des systèmes robotiques à base de VLA. L'effort de robustification s'est jusqu'ici concentré sur les variations perceptuelles et sémantiques : éclairage, occlusion, reformulation d'instructions. Or tout robot industriel accumule friction, chocs et dégradation d'actionneur au fil du temps. Montrer que ces perturbations physiquement réalisables suffisent à faire chuter les performances remet en cause l'hypothèse implicite qu'un VLA entraîné sur hardware neuf reste fiable tout au long de son cycle de vie opérationnel. Pour les intégrateurs et responsables de certification, c'est un signal fort : la robustesse mécanique doit entrer dans les critères de qualification aux côtés de la généralisation sémantique. L'approche J-PARC, sans fine-tuning ni capteur supplémentaire, offre une piste d'adaptation réaliste pour les déploiements existants. Les VLA ont connu une montée en puissance rapide depuis Pi-0 (Physical Intelligence, 2024) et GR00T N2 (NVIDIA, 2025), avec des déploiements annoncés chez Figure (modèle 03), Agility Robotics et 1X Technologies. Malgré leurs performances en laboratoire, leur comportement sur hardware vieillissant reste peu documenté dans la littérature. Ce papier s'inscrit dans une tendance croissante sur la fiabilité opérationnelle à long terme, aux côtés des travaux sur le sim-to-real gap. En Europe, des acteurs comme Enchanted Tools avec Mirokaï ou Wandercraft, où la dégradation articulaire est un enjeu quotidien en milieu médical ou logistique, sont directement concernés par ces résultats. Les prochaines étapes naturelles seront une validation sur hardware en vieillissement accéléré et l'intégration de J-PARC dans des pipelines de déploiement continu.

UELes acteurs français Enchanted Tools et Wandercraft, confrontés à la dégradation articulaire en milieu médical et logistique, peuvent directement intégrer J-PARC pour fiabiliser leurs déploiements VLA sans modifier leurs modèles de base.

💬 On a tous fait cette hypothèse implicite : un VLA entraîné en labo reste fiable sur un robot qui a pris des coups après 18 mois en prod. Ce papier montre que non, et c'est un angle mort réel pour tous les intégrateurs qui déploient en milieu industriel ou médical. J-PARC corrige ça sans toucher au modèle de base, bon, reste à voir si ça tient sur du vrai hardware vieilli.

IA physiqueOpinion
1 source
Contrôle corps entier généraliste et adaptable pour la locomotion de divers humanoïdes
11arXiv cs.RO 

Contrôle corps entier généraliste et adaptable pour la locomotion de divers humanoïdes

Des chercheurs ont publié sur arXiv (référence 2602.05791) un framework baptisé XHugWBC, conçu pour entraîner un contrôleur de locomotion whole-body universel sur une large distribution de morphologies humanoïdes, puis le déployer en zero-shot sur des robots non vus durant l'entraînement. Les expériences couvrent douze humanoïdes simulés et sept robots réels. Le système repose sur trois briques techniques : une randomisation morphologique physiquement cohérente (masse des segments, longueur des membres, inertie), des espaces d'observation et d'action alignés sémantiquement entre châssis hétérogènes, et une architecture de politique qui encode explicitement les propriétés morphologiques et dynamiques de chaque instance. L'entraînement est unique, "one-time training" : aucun fine-tuning par robot n'est requis à l'inférence. L'enjeu industriel est direct. Aujourd'hui, chaque équipe robotique entraîne ses contrôleurs de locomotion depuis zéro pour chaque châssis, ce qui représente des semaines de simulation et d'itérations sim-to-real. XHugWBC déplace ce coût vers une phase d'entraînement généraliste unique, ouvrant la voie à un modèle de déploiement où un intégrateur peut adopter un nouveau châssis humanoïde sans reconstruire l'intégralité de sa stack de contrôle. La validation sur sept robots physiques est plus convaincante que les résultats purement simulés habituels, même si la nature exacte des tâches testées et les taux de succès détaillés ne figurent pas dans le résumé disponible. La capacité de transfert zero-shot sur morphologies inédites renforce l'hypothèse que les biais structuraux appris sur distributions larges surpassent les politiques spécialisées sur certains régimes de locomotion, ce que le secteur débattait encore il y a dix-huit mois. Ce travail s'inscrit dans un mouvement vers les contrôleurs dits "fondation" pour la robotique incarnée. En manipulation, des systèmes comme pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) ont déjà exploré la généralisation cross-embodiment sur bras et effecteurs; l'extension à la locomotion whole-body humanoïde est plus contrainte par la stabilité dynamique. Les acteurs du secteur, Figure Robotics (Figure 03), Unitree (G1, H1), Agility Robotics (Digit), Fourier Intelligence et 1X Technologies, maintiennent tous des pipelines de contrôle propriétaires et spécialisés. Si XHugWBC tient ses promesses à l'échelle, il réduirait significativement la barrière à l'entrée pour les nouveaux constructeurs, notamment les acteurs européens comme Enchanted Tools (Mirokaï) ou Wandercraft, qui ne disposent pas des ressources d'entraînement des géants américains. Le preprint n'a pas encore fait l'objet d'une évaluation par les pairs.

UELes constructeurs humanoïdes français Wandercraft et Enchanted Tools (Mirokaï) sont explicitement identifiés comme bénéficiaires potentiels, ce framework pouvant réduire significativement leurs coûts d'entraînement de locomotion sans nécessiter les ressources des géants américains.

💬 C'est le genre de papier qui résout un vrai problème industriel : chaque robot humanoïde qui sort oblige aujourd'hui à tout réentraîner depuis zéro. Sept robots physiques en zero-shot, c'est pas du tout la même chose que des résultats simulés, ça valide quelque chose de sérieux. Pour Wandercraft ou Enchanted Tools, bien plus contraints en ressources que Figure ou Unitree, ce type de contrôleur généraliste c'est du concret.

IA physiqueOpinion
1 source
Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée
12arXiv cs.RO 

Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée

Un groupe de chercheurs a publié sur arXiv (réf. 2505.01458, version 2, mai 2025) un état de l'art sur l'utilisation des simulateurs physiques pour entraîner des robots à la navigation et à la manipulation dans le cadre de l'IA incarnée (Embodied AI). L'étude analyse comment les moteurs de simulation réduisent le "sim-to-real gap", c'est-à-dire l'écart de performance constaté quand un agent entraîné en simulation est déployé dans le monde réel. Le survey passe en revue les caractéristiques des principaux simulateurs, leurs contraintes matérielles, et propose un inventaire structuré de datasets de référence, métriques d'évaluation et méthodes existantes. Aucun code ou outil nouveau n'est publié: il s'agit d'une contribution bibliographique et méthodologique. Cette revue intervient alors que le sim-to-real gap demeure l'obstacle principal au déploiement industriel de robots humanoïdes et de bras manipulateurs. Entraîner directement sur du matériel réel est coûteux, lent et risqué, ce qui place la simulation au cœur des pipelines de développement des VLA (Vision-Language-Action models) et des systèmes de navigation autonome. En consolidant des propriétés peu documentées des simulateurs, le survey aide ingénieurs et chercheurs à sélectionner l'outil adapté à leurs contraintes hardware sans avoir à faire une veille exhaustive de la littérature. Les simulateurs en compétition dans cet espace incluent Isaac Sim (NVIDIA), MuJoCo (DeepMind/Google), PyBullet, Webots et Genesis, un moteur GPU-natif récent. L'intérêt pour ce type de synthèse est alimenté par l'accélération du secteur: Figure AI, Physical Intelligence (pi zero), Boston Dynamics, Unitree et Agility Robotics multiplient les annonces de déploiements en environnements industriels réels. Ce survey constitue un point d'entrée structuré pour les équipes qui montent leur pipeline sim-to-real en 2025, à condition de ne pas attendre de benchmarks neutres et indépendants: l'évaluation des simulateurs reste largement conduite par leurs propres éditeurs.

RecherchePaper
1 source
Des avancées au Congrès pour créer une Commission nationale sur la robotique
13Robotics Business Review 

Des avancées au Congrès pour créer une Commission nationale sur la robotique

Quatre sénateurs américains bipartisans, Dave McCormick (R-Pennsylvanie), John Hickenlooper (D-Colorado), Todd Young (R-Indiana) et Martin Heinrich (D-Nouveau-Mexique), ont déposé la semaine dernière un projet de loi visant à créer une Commission nationale indépendante sur la robotique. Cette initiative fait écho à la loi H.R. 7334 introduite en février à la Chambre des représentants par Jay Obernolte (R-Californie), Jennifer McClellan (D-Virginie) et Bob Latta (R-Ohio), tous membres du Congressional Robotics Caucus récemment relancé. La commission aurait pour mandat d'évaluer la compétitivité américaine dans le secteur, les risques de la chaîne d'approvisionnement, les politiques étrangères en matière de robotique, les partenariats stratégiques public-privé-académique, et les dispositifs d'attraction des talents STEM. Elle formulerait également des recommandations sur la densité robotique, soit le nombre de robots pour 10 000 employés, indicateur en hausse en Amérique du Nord depuis 2024 selon l'IFR (International Federation of Robotics) et l'A3 (Association for Advancing Automation). L'enjeu principal est la pression concurrentielle exercée par la Chine, qui aurait déployé plus de robots que le reste du monde combiné. Les États-Unis disposent de capacités industrielles, universitaires et entrepreneuriales solides, mais l'absence de stratégie fédérale coordonnée freine leur positionnement. Robert Little, directeur de la stratégie robotique chez Novanta Inc. et lauréat 2026 du Prix Joseph F. Engelberger, formule le diagnostic clairement : reconstruire des usines aux États-Unis sans maîtriser les technologies robotiques qui les font fonctionner revient à reconstituer une dépendance sous une autre forme. Aaron Prather, directeur du programme Robotics & Autonomous Systems chez ASTM International, souligne de son côté que la robotique est en train de devenir une infrastructure critique et que les États-Unis gagneraient à aligner recherche, formation, normalisation et déploiement dans un cadre cohérent, comme l'ont fait d'autres nations industrialisées. Sur le plan historique, les États-Unis n'ont jamais disposé d'une politique robotique fédérale unifiée, contrairement à la Corée du Sud, au Japon ou à l'Allemagne, qui ont mis en place des stratégies nationales depuis plus d'une décennie. Pittsburgh, pôle historique de la robotique américaine via Carnegie Mellon et des acteurs comme Agility Robotics, dont la PDG Peggy Johnson cite explicitement le sénateur McCormick comme soutien clé, illustre ce que peut produire une concentration de talents sans cadre national. La prochaine étape sera l'examen du texte en commission au Sénat ; aucun calendrier de vote n'a été annoncé. Si la commission est créée, ses recommandations n'auraient pas de force contraignante, mais pourraient constituer le socle d'une législation plus structurante sur la politique industrielle robotique américaine.

UESi adoptée, cette commission américaine pourrait accélérer la structuration d'une politique industrielle robotique fédérale aux États-Unis, augmentant la pression concurrentielle sur les acteurs européens dans les segments humanoïdes et industriels où l'UE reste en retrait malgré les stratégies nationales de l'Allemagne, la France 2030 et le plan robotique européen.

RegulationReglementation
1 source
Évaluation des modèles vision-langage-action (VLA) sur SO-101 : analyse des échecs et de la récupération
14arXiv cs.RO 

Évaluation des modèles vision-langage-action (VLA) sur SO-101 : analyse des échecs et de la récupération

Une équipe de chercheurs a publié le 10 juin 2026 (arXiv:2606.08881) un benchmark standardisé pour évaluer des modèles Vision-Language-Action (VLA) sur le robot SO-101, une plateforme manipulatrice à faible coût issue de la communauté open-source. Quatre politiques ont été comparées sur quatre tâches de manipulation représentatives avec des protocoles d'évaluation unifiés : Pi-0.5 (Physical Intelligence), SmolVLA (HuggingFace), Wall-X et ACT (Action Chunking with Transformers, référence en imitation learning). Toutes ont été fine-tunées directement sur le matériel physique à partir de démonstrations télé-opérées en conditions réelles, sans passer par la simulation. Au-delà du simple taux de succès binaire, l'étude introduit une taxonomie structurée des échecs, une décomposition sémantique et d'exécution, ainsi que des métriques de récupération (recovery-aware metrics) pour qualifier la robustesse de chaque architecture. Les résultats confirment que les VLA pré-entraînés sur de larges corpus surpassent globalement la baseline en imitation learning pure, mais cette supériorité reste fortement dépendante de la tâche. Ce point est crucial pour les intégrateurs : l'instabilité d'exécution, et non les erreurs de compréhension sémantique, constitue la source d'échec dominante. La capacité de récupération varie significativement selon les architectures, ce qui suggère que les benchmarks centrés uniquement sur le taux de succès final masquent des différences opérationnelles importantes. Pour un COO industriel, cela signifie que le choix d'un modèle VLA ne peut pas se faire sur des métriques agrégées sans analyser le comportement en cas d'échec partiel. Le SO-101 s'est imposé comme plateforme de référence communautaire grâce à son coût accessible, là où la plupart des évaluations VLA existantes reposent sur des robots industriels onéreux (Franka, UR, Boston Dynamics Spot) ou restent cantonnées à la simulation. Ce travail s'inscrit dans un effort plus large de démocratisation des benchmarks robotiques, face à des acteurs comme Figure AI, Agility Robotics ou 1X Technologies qui évaluent leurs systèmes en environnements propriétaires non reproductibles. Les auteurs positionnent explicitement le SO-101 comme socle pratique pour l'évaluation de l'IA incarnée dans des conditions de déploiement réalistes à faible coût. La prochaine étape naturelle serait d'étendre ce protocole à des scénarios de manipulation plus complexes et à davantage d'architectures VLA émergentes, notamment celles intégrant des retours haptiques.

UESmolVLA de HuggingFace (entreprise française) est directement comparé à Pi-0.5, Wall-X et ACT dans ce benchmark standardisé, offrant une visibilité internationale sur les forces et faiblesses du modèle français face aux architectures VLA concurrentes.

FR/EU ecosystemeActu
1 source
Attaquer les modèles du monde pour compromettre les pipelines d'apprentissage robotique
15arXiv cs.RO 

Attaquer les modèles du monde pour compromettre les pipelines d'apprentissage robotique

Un preprint déposé sur arXiv le 9 juin 2026 (arXiv:2606.09499) expose une classe inédite d'attaques par empoisonnement de données ciblant les world models intégrés aux pipelines d'apprentissage robotique. Contrairement aux attaques traditionnelles qui insèrent directement des trajectoires dangereuses dans un jeu de données vendu ou publié, la méthode décrite ici injecte des prompts malveillants ou des dynamiques de transition compromises dans des datasets de téléopération en apparence sûrs. L'attaque reste dormante jusqu'à ce que ces données soient traitées par un world model, lequel génère alors des trajectoires synthétiques d'entraînement dangereuses, aboutissant au déploiement d'une politique robotique unsafe. Les chercheurs démontrent l'efficacité de l'attaque sur deux paradigmes distincts : les world models conditionnés par l'action (action-conditioned) et ceux conditionnés par le texte (text-conditioned). Résultat concret : un backdoor de bout en bout sur une politique DRL (Deep Reinforcement Learning) en aval, et une preuve de concept dans le cadre VLA (Vision-Language-Action). L'enjeu pour l'industrie est structurel. Les world models sont désormais utilisés comme substituts de données dans les pipelines d'entraînement de robots humanoïdes et industriels, notamment pour réduire le coût de la collecte téléopérée. L'attaque décrite contourne l'hypothèse fondatrice de sécurité dans ces pipelines : que des données ground truth visuellement propres garantissent une politique sûre. Ce n'est pas le cas si le world model interposé est lui-même vulnérable. Pour les intégrateurs qui achètent ou mutualisent des datasets de téléopération, et pour les fournisseurs qui commercialisent des world models pré-entraînés, c'est un vecteur d'attaque supply chain directement actionnable, d'autant plus redoutable qu'il ne laisse aucune trace visible dans les données source. Les world models ont connu une adoption rapide ces dix-huit derniers mois, portée par des travaux comme UniSim, IRASim ou le framework GR00T N2 de NVIDIA, promus comme solution au sim-to-real gap et à la pénurie de données réelles. La recherche s'inscrit dans un contexte où Figure, Agility Robotics et 1X accélèrent leurs déploiements en environnement industriel, rendant la surface d'attaque potentielle concrète et non purement théorique. Les auteurs appellent à reconsidérer la position des world models dans la chaîne d'entraînement et à ouvrir un axe de recherche dédié à leur sécurisation, un chantier aujourd'hui quasi inexistant dans la littérature.

UELes acteurs européens de la robotique qui mutualisent des datasets de téléopération ou intègrent des world models pré-entraînés (startups, intégrateurs, labos comme le CEA-List ou l'INRIA) sont exposés au même vecteur d'attaque supply chain, sans qu'aucun standard de sécurité européen ne couvre encore ce risque spécifique.

RechercheOpinion
1 source
Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés
16arXiv cs.RO 

Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés

Des chercheurs proposent une méthode de récupération après chute pour robots humanoïdes sur terrains variés, publiée en juin 2026 sur arXiv (identifiant 2606.08922). Baptisée PTDL (Phase-Terrain Decoupled Learning), elle cible un problème concret : un humanoïde tombé sur du gravier, une pente ou un sol inégal doit non seulement se relever, mais reprendre immédiatement une marche dirigée par commande de vitesse, sans capteurs externes ni étiquettes de terrain fournies au moment de l'exécution. La validation porte sur le Unitree G1, humanoïde commercial de 29 degrés de liberté, testé en simulation et sur robot réel, sur sol plat, gravier et inclinaisons allant jusqu'à 20 degrés. L'architecture de PTDL repose sur une double décorrélation. Sur l'axe des phases, des discriminateurs de mouvement à double prior conditionnés par la gravité projetée lient la récupération post-chute à la reprise de locomotion normale. Sur l'axe des terrains, un façonnage de récompense stratifié par surface applique des supervisions d'entraînement spécifiques à chaque sol, labels qui sont ensuite retirés à la politique au déploiement : le robot développe des comportements de lever implicitement adaptés à chaque surface, sans qu'on lui indique sur quoi il repose. Les méthodes antérieures s'arrêtaient généralement au lever quasi-statique ou entraînaient une politique de compromis dégradée face à la diversité des terrains. PTDL enchaîne récupération et reprise de marche sous une seule politique proprioceptive unifiée, ce qui est directement pertinent pour tout déploiement en environnement industriel non structuré où la chute n'est pas une exception mais une probabilité réelle. Le G1 de Unitree Robotics (Shenzhen) est devenu en 2024-2025 une plateforme de référence pour la recherche en locomotion humanoïde, notamment grâce à son accessibilité tarifaire (environ 16 000 USD). La récupération après chute reste un angle mort notoire dans la course humanoïde actuelle : Figure AI (Figure 03), Boston Dynamics (Atlas), Agility Robotics (Digit) et Tesla (Optimus) se concentrent principalement sur les démonstrations de marche et de manipulation, peu sur les protocoles de résilience post-chute. Ce preprint arXiv n'annonce pas de déploiement industriel immédiat et n'a pas encore subi de révision par les pairs, mais il ouvre une piste méthodologique solide : entraîner sur des terrains stratifiés tout en maintenant une politique unifiée à l'inférence, une approche transposable à d'autres défis de robustesse en conditions réelles.

RecherchePaper
1 source
ActProbe : sonde dans l'espace d'action pour la détection précoce des défaillances des politiques robotiques génératives
17arXiv cs.RO 

ActProbe : sonde dans l'espace d'action pour la détection précoce des défaillances des politiques robotiques génératives

Des chercheurs ont publié ActProbe (arXiv:2606.08508), un détecteur de défaillances léger pour les politiques robotiques génératives, ces systèmes qui produisent des séquences d'actions continues comme les politiques de diffusion ou les architectures ACT déployées sur des robots tels que Figure 03 ou entraînés avec pi-0. Plutôt que d'accéder aux états internes du modèle ou d'introduire un rééchantillonnage coûteux à l'exécution, ActProbe opère exclusivement sur les chunks d'actions émis lors d'un seul passage avant (forward pass). Deux signaux suffisent : l'erreur de cohérence temporelle (TCE), qui mesure l'incohérence entre deux chunks consécutifs, et l'amplitude du chunk courant (ACM). Ces métriques alimentent une architecture LSTM-MLP légère conditionnée par la tâche, produisant une probabilité de défaillance par étape. Sur un ensemble diversifié de benchmarks, ActProbe améliore le front de Pareto précision (F1)/précocité d'un gain en hypervolume de +12,7 % par rapport aux méthodes existantes, et affiche un avantage de +9,0 % en ROC-AUC sur des tâches non vues à l'entraînement. L'intérêt opérationnel tient à une contrainte réelle : les politiques commerciales comme pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) ne donnent pas accès à leurs états internes. Un détecteur purement black-box est donc la seule option viable en déploiement industriel. ActProbe émet ses alertes avant que la défaillance ne soit visuellement reconnaissable, ce qui est critique pour interrompre une action irréversible avant qu'elle ne soit engagée. Côté fine-tuning par renforcement (PPO), le système réduit de 2,9 fois le nombre d'interactions nécessaires avec l'environnement, un gain direct lorsque chaque interaction implique un robot physique. Le transfert sur des tâches de saisie réelles non vues lors de l'entraînement valide la généralisation hors simulateur. ActProbe s'inscrit dans les travaux ciblant le fossé entre démonstration en laboratoire et déploiement à l'échelle, l'obstacle central à la commercialisation des robots généralistes depuis 2023. Les approches concurrentes, qu'elles reposent sur le monitoring d'incertitude interne ou sur des signaux côté observation, souffrent d'un manque d'accès aux internals ou d'une latence incompatible avec le temps réel. La prochaine étape logique serait l'intégration dans des boucles de contrôle réactives pour robots humanoïdes industriels, terrain où Figure AI, Apptronik et Agility Robotics accélèrent leurs déploiements en entrepôt en 2026. ActProbe reste à ce stade une publication académique préliminaire, sans produit ni partenariat industriel annoncé.

RechercheOpinion
1 source
La diversité est-elle tout ce qu'il faut pour la manipulation robotique à grande échelle ?
18arXiv cs.RO 

La diversité est-elle tout ce qu'il faut pour la manipulation robotique à grande échelle ?

Une équipe de chercheurs publie sur arXiv (référence 2507.06219) une étude systématique sur le rôle de la diversité des données dans l'apprentissage de la manipulation robotique, remettant en cause l'intuition du "plus c'est divers, mieux c'est". Trois dimensions sont examinées indépendamment. La diversité des tâches s'avère plus critique que le volume de démonstrations par tâche pour le transfert vers de nouveaux scénarios. L'entraînement multi-robots (multi-embodiment) n'est pas nécessaire au transfert inter-plateformes : un modèle entraîné sur un seul type de robot avec des données de haute qualité transfère aussi efficacement, avec de meilleures propriétés de scaling au fine-tuning. Enfin, la diversité des experts humains peut nuire à l'apprentissage via la multimodalité des vitesses d'exécution, chaque opérateur ayant ses propres rythmes et préférences gestuelles. Pour corriger ce biais, les auteurs introduisent une méthode de distribution debiasing appliquée à leur modèle GO-1-Pro, qui gagne 15% de performance, l'équivalent de multiplier par 2,5 le volume de pré-entraînement. Ces résultats ont des implications directes pour les équipes qui conçoivent des pipelines de collecte de données. La conclusion sur le multi-embodiment est particulièrement contre-intuitive : constituer un corpus mono-robot de haute qualité avant de fine-tuner est plus efficace qu'accumuler des datasets disparates multi-robots. Pour un intégrateur ou un décideur industriel, cela redéfinit les priorités de curation : couvrir un maximum de tâches prime sur l'accumulation brute de démonstrations, et standardiser les démonstrations expert devient un levier de performance mesurable. La multimodalité des vitesses est désormais un biais identifiable et corrigeable en amont du pipeline, pas une fatalité inhérente à la collecte humaine. Ce travail s'inscrit dans la dynamique portée par Google DeepMind (RT-2), Physical Intelligence (Pi-0) et les équipes de Berkeley (OpenVLA, Octo), qui cherchent à construire des fondations généralistes pour la manipulation depuis 2023. Contrairement au texte ou aux images, les données de démonstration robotique restent coûteuses à produire, ce qui rend les choix de stratégie de scaling particulièrement stratégiques. Les conclusions orientent directement les acteurs comme Figure AI (Figure 03), Agility Robotics ou, en France, Enchanted Tools (Mirokaï), qui investissent dans de larges datasets de manipulation. Ce travail est purement académique : aucun déploiement ni partenariat commercial n'est annoncé.

UEEnchanted Tools (Mirokaï) est explicitement citée comme acteur concerné par ces stratégies de scaling des données de manipulation, rendant les conclusions directement applicables à leur R&D en France.

RecherchePaper
1 source
HANDOFF : contrôle corps entier d'humanoïdes à base d'agents par distillation d'enseignants complémentaires
19arXiv cs.RO 

HANDOFF : contrôle corps entier d'humanoïdes à base d'agents par distillation d'enseignants complémentaires

Des chercheurs présentent dans un preprint arXiv soumis en juin 2026 (2606.06493) HANDOFF, un contrôleur de corps entier pour robots humanoïdes qui vise à réduire le fossé entre planification sémantique et exécution motrice bas niveau. Le problème ciblé est structurel : les contrôleurs existants nécessitent des références cinématiques denses que les planificateurs à base de modèles de langage ou de vision peinent à produire directement depuis une instruction sémantique. HANDOFF introduit un espace de commande compact et explicite, distillé depuis trois enseignants spécialisés via KL distillation avec un mécanisme de gating conditionné au contexte : suivi de mouvement corps entier (avec données filtrées pour la sécurité), locomotion, et récupération de chute. L'architecture produit un modèle étudiant de type mixture-of-experts évalué sur le Unitree G1, avec des démonstrations pilotées en langage naturel via un planificateur agentique à base de VLM (vision-language model), sans fine-tuning spécifique aux tâches. Les résultats revendiqués incluent un suivi de vitesse comparable à l'état de l'art et l'un des plus larges espaces de travail de manipulation robuste parmi les contrôleurs publiés sur cette plateforme. L'enjeu est concret pour les intégrateurs industriels : la multiplication des humanoïdes commerciaux (Figure 03, Agility Digit, Apptronik Apollo, Unitree H1) crée une pression croissante pour des contrôleurs capables de s'interfacer directement avec des planificateurs généralistes sans recourir à du fine-tuning par tâche, coûteux en données et en temps d'ingénierie. Si l'interface proposée tient en dehors des scénarios de démonstration, un planificateur LLM ou VLM pourrait enchaîner des séquences complexes sans modifier la couche bas niveau, ce qui réduit significativement la friction à l'intégration. La récupération de chute embarquée est un atout non-trivial pour les environnements industriels réels. Toutefois, les vidéos sélectionnées et l'absence de métriques quantitatives sur la diversité des scénarios testés invitent à une lecture prudente avant de conclure sur le passage à l'échelle hors laboratoire. Ce travail s'inscrit directement dans la course aux VLA (vision-language-action models) post-2024, avec des concurrents explicites comme Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA, Helix de Figure, et les architectures de OpenVLA ou Octo côté académique. HANDOFF se distingue par une distillation multi-enseignants plutôt qu'un entraînement end-to-end unifié, une stratégie proche des travaux de l'ETH Zurich sur ANYmal en quadrupède. Le choix du Unitree G1 (commercialisé autour de 16 000 dollars) est cohérent avec une visée de reproductibilité académique large. Les prochaines étapes probables incluent des évaluations sur des tâches de manipulation plus diversifiées, des tests en environnements non structurés, et potentiellement un transfert vers des plateformes humanoïdes commerciales plus musclées.

IA physiqueOpinion
1 source
Attaques adversariales par patches partiellement observables sur les modèles VLA en robotique
20arXiv cs.RO 

Attaques adversariales par patches partiellement observables sur les modèles VLA en robotique

Des chercheurs ont publié début juin 2026 une étude (arXiv:2606.03556) démontrant la vulnérabilité des modèles Vision-Language-Action (VLA) à des attaques adversariales par patch dans des conditions partiellement observables. Contrairement aux travaux antérieurs qui supposaient un accès complet à l'intégralité de la trajectoire d'exécution du robot, cette équipe formule un modèle de menace plus réaliste : l'adversaire ne dispose que d'un court préfixe de trajectoire pour générer un patch visuel fixe, ensuite appliqué à toutes les trames suivantes. Leur framework en deux phases consiste d'abord à localiser la zone optimale du patch en exploitant les cartes d'attention du modèle pour identifier les régions visuellement critiques liées à l'instruction en cours, puis à optimiser ce patch pour simultanément perturber l'ancrage sémantique des objets cibles et augmenter la courbure des trajectoires d'action planifiées. Les expériences menées en simulation et en environnements robotiques réels montrent une réduction significative des taux de succès sur des tâches longues. Ce résultat est important car les VLA sont de plus en plus intégrés dans des bras manipulateurs et des robots mobiles déployés en environnements industriels et logistiques, précisément parce qu'ils promettent une généralisation robuste à partir d'instructions en langage naturel. Prouver qu'un patch physique imprimable, placé dans le champ de vision du robot, peut dégrader durablement ses performances de contrôle sans accès complet à son état interne remet en question les hypothèses de sécurité des déploiements actuels. Cela soulève un gap réel entre robustesse en démo contrôlée et résilience en production, particulièrement pour des intégrateurs qui s'appuient sur des modèles comme OpenVLA, pi-0 (Physical Intelligence) ou RT-2 (Google DeepMind) sans auditer leur surface d'attaque perceptive. Les VLA connaissent une montée en puissance depuis 2023 avec RT-2 de Google, suivi de pi-0 de Physical Intelligence et des travaux d'Embodied Intelligence. La sécurité adversariale de ces modèles reste un angle quasi-inexploré dans la littérature par rapport à leur homologues LLM ou vision-langage purs. Cette publication s'inscrit dans un effort émergent pour caractériser les vecteurs d'attaque physiques sur les systèmes robotiques autonomes, un enjeu croissant alors que Figure AI, Agility Robotics et 1X Technologies accélèrent leurs déploiements en entrepôt. Les prochaines étapes probables incluent des défenses basées sur l'augmentation adversariale à l'entraînement et des mécanismes de détection d'anomalie sur les cartes d'attention, domaine dans lequel des équipes européennes comme celles du LAAS-CNRS et du DLR commencent également à publier.

UELes équipes du LAAS-CNRS et du DLR commencent à publier sur la défense adversariale des VLA, positionnant l'Europe comme contributrice émergente à la sécurisation des déploiements robotiques industriels.

RechercheOpinion
1 source
SimuScene : reconstruction compositionnelle de scènes 3D prêtes pour la simulation à partir d'une seule image
21arXiv cs.RO 

SimuScene : reconstruction compositionnelle de scènes 3D prêtes pour la simulation à partir d'une seule image

Une équipe de chercheurs a présenté SimuScene (arXiv:2606.03994, juin 2026), un pipeline de reconstruction 3D compositionnelle capable de produire, à partir d'une seule image, des scènes directement exploitables dans un simulateur physique. Le verrou technique adressé est précis : les méthodes existantes de reconstruction mono-image génèrent des géométries par objet plausibles visuellement, mais dès qu'on les compose dans une scène et qu'on lance la simulation, les objets s'interpénètrent, flottent ou s'enfoncent dans le sol, rendant la scène inutilisable pour l'entraînement robotique. SimuScene résout ce problème en intégrant le moteur physique non pas comme une étape de correction a posteriori, mais comme un outil de diagnostic pendant le processus de reconstruction lui-même. Concrètement, les objets reconstruits sont soumis à une simulation gravitationnelle ; les échecs de pénétration ou de support sont convertis en signaux de correction quantitatifs qui pilotent deux mécanismes : un étirement de la géométrie selon l'axe vertical ("gravity-axis stretching") et un rééchantillonnage de la forme amodale pour les parties non visibles. Les auteurs rapportent des résultats état de l'art sur des benchmarks de stabilité physique et d'alignement géométrique, et valident l'utilité de la pipeline sur des tâches de manipulation bras robotique et de contrôle humanoïde. Pour l'industrie robotique et la recherche en manipulation, l'enjeu est direct : l'un des goulots d'étranglement majeurs dans la génération de données simulées est la constitution d'environnements 3D physiquement cohérents. Si une seule image suffit à produire une scène immédiatement utilisable dans un simulateur comme Isaac Sim ou MuJoCo, le coût de création de données d'entraînement pour les VLA (Vision-Language-Action models) et les politiques de manipulation chute drastiquement. L'approche "physics-in-the-loop" pendant la génération, plutôt qu'en correction post-hoc, est une distinction architecturale importante : elle corrige les erreurs géométriques à la source plutôt que de les masquer par un réarrangement de layout, ce qui limite les artefacts cumulatifs. Cela dit, le papier étant un preprint, les benchmarks présentés restent à valider par la communauté, et les métriques de performance sur les tâches robotiques aval (taux de succès de saisie, généralisation hors distribution) ne sont pas détaillées dans l'abstract. SimuScene s'inscrit dans un axe de recherche actif depuis 2022 environ, alimenté par la convergence entre les reconstructeurs 3D génératifs (Zero-1-to-3, One-2-3-45, LRM) et le besoin croissant de données synthétiques pour l'entraînement de robots physiques. Les concurrents directs incluent les méthodes de layout correction physique comme PhyScene ou les pipelines de génération de scènes pour la simulation (GENESIS, RoboVerse), qui opèrent eux aussi sur ce créneau sim-to-real mais partent généralement de descriptions textuelles ou de scans multi-vues. La force revendiquée de SimuScene est la contrainte d'entrée minimale (une image) combinée à la validité physique en sortie. Les applications démontrées sur le contrôle humanoïde suggèrent un intérêt pour les labos travaillant sur des plateformes comme Figure 03, Unitree H1 ou Agility Digit, où la génération rapide d'environnements d'entraînement en simulation reste un facteur limitant. Aucun partenariat industriel ni timeline de déploiement n'est mentionné ; il s'agit pour l'instant d'un résultat de recherche académique.

RecherchePaper
1 source
Stardust Intelligence lève plus d'un milliard de yuans en série B, sa valorisation dépasse 10 milliards
2236Kr 

Stardust Intelligence lève plus d'un milliard de yuans en série B, sa valorisation dépasse 10 milliards

Astribot (星尘智能), startup shenzhenoise spécialisée dans les humanoïdes à transmission par câble, a bouclé une série B représentant plus d'un milliard de yuans (environ 125 millions d'euros) en trois tours sur trois mois. Sa valorisation dépasse désormais 10 milliards de yuans, la hissant au rang de licorne shenzhenoise de l'embodied intelligence. Le tour réunit des fonds régionaux (Liangxi Tech Innovation Fund géré par Bohua Capital, Yangzhou Longtou Xinli), l'industriel ThinkTech (中科创达), GUOKE Investment, et confirme le réinvestissement d'actionnaires historiques liés à Tencent, Alibaba et ByteDance. Sur le plan commercial, Astribot signe une commande de l'ordre du millier d'unités avec ThinkTech pour des applications industrielles et de services, avec expansion à l'export, ainsi que la co-construction d'un centre d'application de 100 millions de yuans avec la zone de développement économique de Jiangdu pour l'hôtellerie et le tourisme culturel. La gamme T1, lancée à 89 900 yuans (environ 11 500 euros), exécute des tâches en séquence continue : cuisson, service en bar, tri de pièces automobiles, manipulation chimique. Des livraisons à l'échelle du millier d'unités ont démarré fin 2025. Ce qui distingue Astribot sur le plan technique, c'est son choix de la transmission tendineuse par câble (rope-driven), imitant la biomécanique musculaire humaine : moteurs déportés, câbles tractant les articulations, avec un couplage rigide-souple qui préserve la rigidité opérationnelle tout en absorbant les chocs. L'entreprise revendique être la première au monde à avoir industrialisé cette approche en production de masse pour des humanoïdes IA. Pour les intégrateurs, cela signifie un meilleur rapport charge utile/masse, moins de backlash mécanique, et des données de force proprioceptives de haute qualité transmises fidèlement au modèle, un avantage critique pour l'apprentissage de la physique réelle. L'intelligence embarquée repose sur DuoCore, une architecture bicéphale rapide/lente inspirée du double système cognitif humain, structurellement convergente avec l'architecture Helix de Figure dévoilée quasi simultanément, ce qui constitue une validation indépendante de cette direction. Le système rapide gère la compliance articulaire et l'évitement d'obstacles en temps réel ; le système lent planifie les tâches longues et coordonne les deux bras. Le modèle de fondation VLA maison, Lumo, entraîné par pré-entraînement puis alignement sur robot physique, affiche une généralisation à des objets inconnus et des environnements non vus. DuoCore est déjà déployé en conditions réelles dans la distribution au détail dans six villes chinoises, ce qui constitue un déploiement opérationnel, pas une démonstration en laboratoire. Astribot a été fondée en 2022 par Lai Jie, qui cumule 17 ans d'expérience en IA et robotique : il a été le premier employé et architecte du laboratoire de robotique de Tencent, puis directeur de l'équipe robot Xiaodu chez Baidu. Sa philosophie "Design for AI" consiste à concevoir d'abord un corps adapté à l'apprentissage par un grand modèle, puis à y adjoindre l'algorithme, structurant ainsi toute l'architecture produit. L'entreprise s'inscrit dans un secteur très concurrentiel face à Unitree (G1, H1), Figure (02, Helix), Boston Dynamics (Atlas électrique), Agility Robotics (Digit), et côté chinois, Fourier Intelligence et Galbot. Sa différenciation repose sur la transmission câblée et une stratégie de données axée sur l'efficacité plutôt que le volume brut. Les prochaines étapes annoncées incluent l'internationalisation des commandes ThinkTech et l'intégration de capacités de modèle du monde (world model) dans les futures versions de Lumo.

UELa montée en puissance d'Astribot renforce la pression concurrentielle sur les acteurs européens de l'humanoïde (Wandercraft, Enchanted Tools) ; l'internationalisation annoncée des commandes ThinkTech pourrait atteindre l'Europe, mais aucun déploiement ou partenariat européen n'est confirmé à ce stade.

Chine/AsieOpinion
1 source
Unitree obtient le feu vert pour son introduction en bourse, un groupe soutenu par Meituan s'impose comme actionnaire principal
23TechNode 

Unitree obtient le feu vert pour son introduction en bourse, un groupe soutenu par Meituan s'impose comme actionnaire principal

Unitree Robotics a obtenu le feu vert du comité de cotation du STAR Market de Shanghai pour son introduction en bourse, avec une approbation prononcée en seulement 73 jours après acceptation du dossier le 20 mars 2026, ce qui constitue un record de rapidité pour cette place boursière dédiée aux entreprises technologiques. Le fabricant de robots prévoit de lever 4,2 milliards de yuans (620 millions de dollars), avec une capitalisation initiale attendue à au moins 42 milliards de yuans (6,2 milliards de dollars), sur la base d'un flottant minimum de 10 %. Dans son prospectus, Unitree affiche pour 2025 un chiffre d'affaires de 1,699 milliard de yuans (250 millions de dollars) et un bénéfice net de 278 millions de yuans (41 millions de dollars). La société déclare avoir livré plus de 5 500 robots humanoïdes sur la période, un volume qui reste à contextualiser : les modèles concernés, les prix de vente et la répartition entre clients industriels et académiques ne sont pas précisés dans le dossier public. Ces chiffres placent Unitree parmi les rares acteurs du secteur humanoïde à présenter une rentabilité nette avant introduction en bourse, dans un secteur où la quasi-totalité des concurrents occidentaux restent en phase de financement de R&D. Pour les intégrateurs et décideurs industriels, cela signale une capacité de production à l'échelle et une structure de coûts que des acteurs comme Figure, Agility Robotics ou 1X ne peuvent pas encore revendiquer publiquement. La profitabilité d'Unitree valide l'hypothèse que le marché de la robotique humanoïde bas de gamme à haut volume peut être rentable avant la résolution complète des défis de manipulation avancée. Fondée en 2016 par Wang Xingxing, Unitree s'est d'abord imposée sur le marché des robots quadrupèdes (Go1, Go2, B2) avant de pivoter vers l'humanoïde avec les modèles H1 et G1. La rapidité de l'approbation réglementaire reflète l'intérêt stratégique des autorités chinoises pour la robotique, dans un contexte de compétition technologique directe avec les États-Unis. Le tour de table reflète un alignement de l'écosystème tech chinois : les entités liées à Meituan détiennent 9,65 % du capital, en devenant le premier actionnaire externe, devant Sequoia China (7,11 %), Tencent, Alibaba et Ant Group. La date effective d'entrée en bourse n'a pas encore été communiquée.

UEL'IPO d'Unitree à 6,2 milliards de dollars de valorisation, avec une rentabilité nette démontrée, accentue la pression concurrentielle sur les fabricants européens de robots humanoïdes qui restent en phase de R&D déficitaire.

Chine/AsieActu
1 source
NVIDIA dévoile une plateforme complète pour robots humanoïdes, robotaxis et usines intelligentes
24Interesting Engineering 

NVIDIA dévoile une plateforme complète pour robots humanoïdes, robotaxis et usines intelligentes

Lors du GTC Taipei, NVIDIA a dévoilé une plateforme full-stack destinée aux robots humanoïdes, aux véhicules autonomes et à l'automatisation industrielle. Le cœur de l'annonce est Cosmos 3, un omnimodèle fondational open-source construit sur une architecture mixture-of-transformers, capable de traiter simultanément texte, images, vidéo, son et commandes d'action dans un seul système. Il se décline en Cosmos 3 Super, orienté haute précision pour la robotique et les véhicules autonomes, et Cosmos 3 Nano, optimisé pour l'inférence rapide. NVIDIA lance également l'Isaac GR00T Reference Humanoid Robot, un design de référence intégrant le robot Unitree H2 Plus, les mains articulées Sharpa, le calculateur embarqué Jetson Thor et la pile logicielle GR00T, adopté par Ai2, ETH Zurich, Stanford Robotics Center et UC San Diego. La collaboration avec TSMC porte les bibliothèques CUDA-X dans la fab pour la lithographie computationnelle, la simulation de transistors et l'inspection de plaquettes à l'échelle nanométrique. Alpamayo 2 Super, un modèle de raisonnement à 32 milliards de paramètres, cible quant à lui les applications robotaxi. La cohérence verticale de la plateforme est sa principale valeur ajoutée : NVIDIA prétend désormais couvrir l'intégralité de la chaîne de valeur de l'IA physique, de la génération de données synthétiques à la simulation, jusqu'au déploiement en production. Pour les équipes R&D en robotique humanoïde, GR00T Reference Robot réduit potentiellement plusieurs mois d'intégration hardware/software. Cosmos 3 s'attaque par ailleurs au sim-to-real gap en proposant un world model capable de générer des environnements d'entraînement réalistes, l'un des verrous structurels du secteur. Cela dit, les benchmarks avancés ("meilleur modèle ouvert" sur plusieurs évaluations) émanent de NVIDIA lui-même sans validation tierce, ce qui invite à une lecture prudente. L'intégration dans la fab TSMC est plus tangible : des gains d'efficacité mesurables dans la détection de défauts nanométriques signalent une adoption industrielle réelle, pas seulement un proof-of-concept. NVIDIA construit ce positionnement depuis plusieurs années via Isaac Sim, Omniverse et la famille GR00T N2 présentée en 2025. Sur le marché des humanoïdes, les concurrents directs incluent Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0), Boston Dynamics (Atlas) et Agility Robotics (Digit). Le choix du robot Unitree H2 Plus, acteur chinois concurrent sur le segment humanoïde, comme base matérielle du design de référence NVIDIA est notable. En Europe, Enchanted Tools (Miroki, France) et Wandercraft pourraient tirer parti de Cosmos 3 pour la génération de données d'entraînement, même si aucun partenariat public n'a été annoncé. Les prochaines étapes incluent l'accès des institutions de recherche à GR00T Reference Robot et la disponibilité de Cosmos 3 via NVIDIA NGC ; aucune tarification ni date de commercialisation n'a été communiquée pour l'ensemble de la plateforme.

UEEnchanted Tools et Wandercraft pourraient exploiter Cosmos 3 pour la génération de données d'entraînement, et ETH Zurich figure parmi les partenaires de recherche du GR00T Reference Robot, mais aucun déploiement commercial en Europe n'est confirmé à ce stade.

💬 NVIDIA ne vend plus du silicium, il vend une plateforme verticale, de la simulation jusqu'au robot en prod. Le détail qui m'a accroché : le choix d'Unitree, concurrent chinois direct, comme base matérielle du robot de référence GR00T. C'est soit du pragmatisme pur, soit une façon de dire que l'avantage NVIDIA est dans le software, pas le hardware.

IA physiqueOpinion
1 source
Le robot humanoïde LeRobot de Hugging Face à 2 500 dollars rend la robotique imprimée en 3D accessible
25Interesting Engineering 

Le robot humanoïde LeRobot de Hugging Face à 2 500 dollars rend la robotique imprimée en 3D accessible

Hugging Face a dévoilé LeRobot Humanoid, une plateforme bipedale open-source entièrement imprimable en 3D évaluée à environ 2 500 dollars en composants, soit un facteur 40 à 100 en dessous des systèmes humanoïdes commerciaux habituels. Le kit publié comprend des fichiers mécaniques imprimables, une liste de matériaux complète, des instructions d'assemblage et de câblage, ainsi que des outils de configuration moteur. Dans sa version initiale, le robot se limite à la locomotion du bas du corps : station debout, marche expérimentale, calibration et test de politiques de locomotion par renforcement. Les composants structurels sont remplaçables à la demande, ce qui permet une itération matérielle rapide sans reconstruire l'ensemble du système. La plateforme s'intègre au framework LeRobot-legged-zoo avec des environnements de simulation MJLab, et inclut un pipeline sim-to-real : les données collectées sur le robot physique sont rejouées en simulation pour affiner les paramètres du modèle et améliorer la fiabilité du transfert de politique. Un workflow de conception orienté contrôle permet en outre de valider des stratégies d'équilibre sur des représentations simplifiées avant de finaliser la géométrie mécanique, réduisant les coûts de développement en amont. Ce projet représente un changement de repère concret pour les laboratoires universitaires et les petites équipes de R&D en robotique bipedale. Le seuil d'entrée à 2 500 dollars contraste avec les plateformes humanoïdes commerciales comme l'Optimus Gen 2 de Tesla, le Figure 03 ou l'Atlas de Boston Dynamics, dont les coûts dépassent largement les 100 000 dollars et dont l'accès reste conditionné à des partenariats industriels sélectifs. En rendant le matériel reproductible et le workflow sim-to-real accessible, Hugging Face permet des cycles d'itération hardware bien plus courts, une hypothèse centrale de la robotique académique que peu d'acteurs avaient traduite en produit à ce prix. Il faut cependant noter que les performances de locomotion annoncées restent à valider indépendamment : aucune métrique de vitesse de marche, de cycle time ou de robustesse aux perturbations n'est communiquée dans la documentation publiée, ce qui place le projet davantage du côté plateforme d'expérimentation que système opérationnel validé. Ce lancement s'inscrit dans la stratégie hardware d'Hugging Face, initiée en avril 2025 avec l'acquisition de Pollen Robotics, startup bordelaise créatrice du robot humanoïde open-source Reachy 2. C'est la première incursion de l'entreprise new-yorkaise dans le matériel physique, et elle se fait via un acteur français dont l'expertise en robotique open-source est établie depuis plusieurs années. L'objectif déclaré est de construire un écosystème complet combinant matériel, simulation, outils logiciels et systèmes d'entraînement, en miroir de ce que la bibliothèque LeRobot représente déjà pour les bras manipulateurs low-cost. Face à des acteurs comme Unitree Robotics, qui propose déjà le G1 à moins de 20 000 dollars, ou à Agility Robotics et Apptronik qui ciblent des déploiements industriels à grande échelle, Hugging Face se positionne clairement sur le segment recherche et prototypage. L'intégration du haut du corps et les capacités de manipulation complète restent inscrites dans la feuille de route sans date précise, ce qui signifie que la plateforme est pour l'instant un outil de locomotion, pas encore un humanoïde complet.

UELe lancement de LeRobot Humanoid est directement ancré dans l'expertise de Pollen Robotics, startup bordelaise acquise par Hugging Face en avril 2025, positionnant la France comme pierre angulaire de l'écosystème mondial de la robotique humanoïde open-source.

FR/EU ecosystemeOpinion
1 source
Contrôle des robots humanoïdes avec conscience de la force pour les mains multidoigts
26arXiv cs.RO 

Contrôle des robots humanoïdes avec conscience de la force pour les mains multidoigts

Des chercheurs de l'Istituto Italiano di Tecnologia (IIT, Gênes) ont publié sur arXiv (2603.08142v2) un framework de contrôle force-aware pour mains multi-doigts sur robots humanoïdes. Le système exploite cinq capteurs magnétiques Xela pour estimer les forces de contact en temps réel, sans recourir aux signaux tactiles bruts. Un dataset de signaux tactiles couplés à des mesures de force ground-truth a été constitué via des interactions avec des indenters calibrés, puis utilisé pour entraîner des estimateurs de force. Le contrôleur résultant coordonne simultanément le torse, le bras, le poignet et les doigts pour redistribuer les forces de contact et maintenir une prise stable sur des objets à distribution de masse variable. Sur une tâche d'équilibrage impliquant cinq objets distincts, le framework atteint 82,7 % de taux de succès, et 80 % de précision dans des scénarios multi-objets. L'approche est notable car elle s'appuie sur des forces estimées plutôt que sur des signaux capteurs spécifiques, ce qui la rend théoriquement transférable à tout capteur capable de produire une estimation de force, sans recalibration du contrôleur. Le noeud technique central est la minimisation de la distance entre le Centre de Pression (CoP) et le centroïde du polygone de contact des doigts, un critère classique de stabilité de prise en mécanique du contact. Ce choix de critère explicite, couplé à un schéma de contrôle model-based, contraste avec les approches purement apprentissage (VLA, imitation learning) dominantes dans les humanoïdes commerciaux actuels, où l'interprétabilité de la commande reste limitée. Pour les intégrateurs industriels, c'est un signal que le sim-to-real pour la manipulation dextre peut passer par des architectures hybrides capteur-modèle plutôt que par du bout-en-bout. L'IIT est l'un des laboratoires européens les plus actifs en robotique humanoïde, connu notamment pour le robot iCub et ses travaux fondateurs sur la manipulation dextre et la peau artificielle. Ce travail s'inscrit dans la lignée de recherches sur le contrôle de contact multi-doigts, un domaine où des acteurs comme Shadow Robot (UK), Sanctuary AI (Canada) ou Agility Robotics (USA) progressent également, mais via des stacks propriétaires moins publiés. Le code et les données sont disponibles en open source sur GitHub (hsp-iit/multifingered-force-aware-control), ce qui facilite la reproduction et l'adaptation. Les prochaines étapes naturelles seraient une validation sur des scénarios d'assemblage réels et une intégration avec des politiques de plus haut niveau pour la planification de saisie.

UEL'IIT (Gênes) publie en open source un framework de contrôle dextre pour humanoïdes avec métriques concrètes, offrant aux laboratoires et industriels européens un outil directement reproductible pour la manipulation multi-doigts sans dépendance à des capteurs propriétaires.

FR/EU ecosystemePaper
1 source
Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée
27Interesting Engineering 

Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée

Astribot, startup robotique de Shenzhen également connue sous le nom Stardust Intelligence, a ouvert les commandes de son humanoïde T1 à partir de 13 000 dollars, soit environ sept fois moins cher que son propre modèle phare S1 vendu près de 100 000 dollars. Le T1 est un humanoïde à base roulante de 155 cm pour 66 kg, doté de 23 degrés de liberté hors effecteurs, avec une capacité de charge de 5 kg par bras. Son architecture motrice repose sur des câbles tendus, la même approche que le S1, conçue pour produire des mouvements plus fluides qu'un entraînement par engrenages traditionnels. Il accepte des pinces robotiques standard et des mains à cinq doigts pour la manipulation fine, et cible des applications comme la cuisine, les opérations en laboratoire, le pliage du linge, le tri de pièces automobiles et la recharge de véhicules électriques. L'IA embarquée est entraînée principalement par démonstration humaine plutôt que par téléopération, une méthode d'imitation learning qui permet au robot d'apprendre des workflows en observant un opérateur humain. Le seuil des 13 000 dollars modifie le calcul économique pour les intégrateurs et les équipes qui souhaitent piloter l'humanoïde en environnement industriel. À titre de comparaison, le Unitree G1 reste l'une des rares références sous 20 000 dollars sur le marché mondial; les offres Figure 03, Agility Digit ou Boston Dynamics Electric Atlas se négocient bien au-delà. Si le T1 tient ses performances hors laboratoire, il pourrait abaisser la barrière d'entrée pour des secteurs à marges serrées comme la logistique légère ou l'assemblage à faible volume. Il convient cependant d'être prudent: Astribot liste des tâches réussies sans publier de métriques de cadence ni de données de robustesse en conditions industrielles réelles, et les vidéos de démonstration restent sélectionnées par l'entreprise. C'est une ouverture de commandes, pas un déploiement en volume documenté. Fondée en 2022 et basée à Shenzhen, Astribot s'est fait connaître à la World Robot Conference de Pékin en août 2024 avec le S1, humanoïde bimanuel de 170 cm et 90 kg aux 23 DOF (7 par bras, 4 pour le torse, 2 pour la tête, 3 pour la base omnidirectionnelle). Une publication arXiv de juillet 2025 détaillait la suite logicielle Astribot Suite, combinant collecte de données en réalité virtuelle, politiques d'imitation learning et optimisation de trajectoire en temps réel, avec des taux de réussite annoncés entre 80 et 100% sur tâches sélectionnées. La startup a levé environ 100 millions de dollars depuis 2024. Sur le segment prix du T1, les concurrents directs incluent le Unitree G1 et, dans une moindre mesure, les robots de recherche comme le GR00T N2 de NVIDIA. Aucun acteur européen ne se positionne encore clairement sur ce créneau accessible. La démonstration de robustesse en milieu non contrôlé et l'annonce de premiers clients industriels constitueront les prochaines étapes décisives pour valider l'ambition commerciale d'Astribot.

UELa démocratisation des prix sur ce segment pourrait inciter des intégrateurs européens à évaluer un pilote humanoïde, mais aucun déploiement ni partenariat européen n'est mentionné.

HumanoïdesOpinion
1 source
La startup qui veut mettre un humanoïde dans chaque usine et peut-être dans chaque maison
28Robot Magazine FR 

La startup qui veut mettre un humanoïde dans chaque usine et peut-être dans chaque maison

Figure AI a bouclé en septembre 2025 une Série C supérieure à un milliard de dollars, portant sa valorisation à 39 milliards de dollars, soit davantage que tout autre fabricant de robots humanoïdes au monde et davantage que plusieurs constructeurs automobiles cotés en bourse. Fondée en 2022 par Brett Adcock, entrepreneur serial issu des secteurs de l'emploi tech (Vettery, cédée à Adecco) et de l'aviation électrique (Archer Aviation), la startup a franchi trois générations de robots en moins de quatre ans. Figure 01, prototype de 1,67 mètre pour 60 kg présenté fin 2022, a servi à lever une Série B de 675 millions de dollars en 2024 (valorisation 2,6 milliards) auprès de Microsoft, NVIDIA, l'OpenAI Startup Fund, Jeff Bezos via Bezos Expeditions, Intel Capital et ARK Invest. Figure 02 a été déployé en conditions réelles à l'usine BMW de Spartanburg, Caroline du Sud, où il a accumulé plus de 1 250 heures de fonctionnement sur des postes de dix heures, cinq jours par semaine, chargeant des pièces en tôle sur des gabarits de soudure, soit plus de 90 000 pièces et une contribution annoncée à la production de quelque 30 000 BMW X3. Figure 03, lancé en octobre 2025, cible simultanément l'industrie et le résidentiel, avec 44 degrés de liberté, un revêtement souple pour la sécurité au contact humain, une recharge sans fil et une interface audio repensée. Une nouvelle levée est anticipée pour 2026-2027. Le chiffre de 30 000 véhicules est l'élément central à retenir, parce qu'il est difficile à fabriquer de toutes pièces. Les démos de laboratoire sont monnaie courante dans la robotique humanoïde ; onze mois de production réelle sur une ligne BMW, avec des métriques de rendement vérifiables par l'OEM, c'est une autre catégorie de preuve. Pour un intégrateur ou un directeur industriel, cela démontre que le fossé simulation-réel est franchissable sur des tâches de manutention répétitive et que le déploiement n'exige pas de réaménager les lignes existantes, argument décisif pour les sites legacy. L'entrée au capital de Brookfield Asset Management et Macquarie Capital, deux gestionnaires d'actifs alternatifs qui traitent l'infrastructure comme une classe d'actifs, signale que Figure AI est désormais lue comme un opérateur d'infrastructure productive, pas comme un pari de recherche, ce qui a une incidence directe sur les conditions de financement de ses clients industriels. Figure AI s'inscrit dans une course à la commercialisation qui oppose désormais au moins cinq acteurs significatifs : Tesla avec Optimus Gen 3, en déploiement annoncé dans ses propres usines ; Agility Robotics, dont le robot Digit est déjà opérationnel dans des entrepôts Amazon ; Apptronik et son Apollo, en pilote chez Mercedes-Benz ; Physical Intelligence avec son modèle de contrôle Pi-0, orienté software-first ; et Boston Dynamics dont l'Atlas électrique commence à apparaître sur des sites industriels réels. En France et en Europe, aucun acteur ne joue encore dans cette catégorie de robots humanoïdes généralistes, bien qu'Enchanted Tools (Miroki, Île-de-France) et Wandercraft (exosquelette) occupent des niches adjacentes. La prochaine étape pour Figure est la montée en volume de Figure 03 sur le marché industriel et, plus spéculativement, l'entrée dans le résidentiel, segment où le chiffre d'affaires unitaire est inférieur mais le marché adressable potentiellement plus large, à condition de résoudre des contraintes de sécurité et de coût que les annonces actuelles n'abordent pas encore frontalement.

UEAucun déploiement européen annoncé, mais la maturité industrielle démontrée par Figure AI chez BMW creuse l'écart compétitif avec les acteurs européens (Enchanted Tools, Wandercraft) qui n'opèrent pas encore dans la catégorie des humanoïdes généralistes en production réelle.

HumanoïdesOpinion
1 source
Figure accélère la production de robots humanoïdes à une vitesse sans précédent
29Robotics & Automation News 

Figure accélère la production de robots humanoïdes à une vitesse sans précédent

Figure AI revendique avoir franchi un seuil critique dans la fabrication en série de son robot humanoïde Figure 02, après des années de prototypes soigneusement mis en scène. La société californienne affirme produire des centaines d'unités de manière fiable et répétable, une étape que peu d'acteurs humanoïdes ont atteinte. Déployé dans l'usine BMW de Spartanburg (Caroline du Sud) depuis 2024, le Figure 02 effectue des tâches de manutention en environnement industriel réel, aux côtés d'opérateurs humains, et la cadence de production annoncée marque un tournant net par rapport aux démonstrations contrôlées qui ont longtemps dominé le secteur. Cette montée en cadence répond à la question centrale du secteur : la transition de la démonstration au déploiement industriel à grande échelle. Si Figure confirme ses chiffres, cela valide un modèle économique difficile à atteindre, celui d'un humanoïde viable non plus comme exploit isolé, mais comme produit industriel reproductible. Pour les intégrateurs et les décideurs B2B, c'est un signal concret que la fenêtre de déploiement s'ouvre, même si les métriques précises de cadence restent à vérifier indépendamment des communications de la société. Fondée en 2022 par Brett Adcock, Figure AI a levé 675 millions de dollars en février 2024, avec Microsoft, OpenAI, NVIDIA et Intel comme investisseurs. Le partenariat BMW reste le déploiement de référence du secteur. La concurrence est dense : Tesla (Optimus), Physical Intelligence (Pi-0), Agility Robotics et Apptronik avancent sur leurs propres feuilles de route, tandis que Figure préparerait l'élargissement de ses contrats industriels au-delà de son partenaire automobile.

UEBMW étant l'adopteur industriel de référence et acteur européen central, une montée en cadence confirmée de Figure AI pourrait accélérer les décisions de déploiement pilote dans les usines automobiles européennes à horizon 2026-2027.

HumanoïdesOpinion
1 source
La nouvelle usine d'ENGINEAI (12 000 m²) produit un robot humanoïde toutes les 15 minutes
30Interesting Engineering 

La nouvelle usine d'ENGINEAI (12 000 m²) produit un robot humanoïde toutes les 15 minutes

ENGINEAI, startup robotique fondée en octobre 2023 et basée à Shenzhen, a inauguré une usine de fabrication en série de robots humanoïdes dans le district de Honghualing. L'installation couvre environ 12 000 m² et intègre l'ensemble de la chaîne de valeur : contrôle qualité entrant, tests de composants, assemblage, tests pré-expédition, logistique et service après-vente. Selon l'entreprise, la cadence de production atteint un robot toutes les 15 minutes, soit potentiellement jusqu'à 35 000 unités par an en rythme continu. Chaque machine doit passer 79 contrôles qualité et 46 tests de simulation avant expédition. Les premiers exemplaires du T800, robot humanoïde polyvalent à vocation industrielle lourde, ont déjà quitté la chaîne. En parallèle, ENGINEAI prépare un second site à Zhengzhou, dans la province du Henan, dédié à une ligne de production de 10 000 unités supplémentaires, intégrée dans le Yunzhi Science Park. Cette expansion s'appuie sur une levée de fonds de série B de 200 millions de dollars clôturée en avril 2026, valorisant la société à plus de 10 milliards de yuans (environ 1,4 milliard de dollars). Le passage à une production industrielle cadencée représente un signal structurant pour le secteur. Jusqu'ici, la quasi-totalité des constructeurs d'humanoïdes, y compris des acteurs bien financés comme Figure ou 1X, opéraient en mode artisanal ou semi-série, avec des volumes annuels comptés en dizaines ou centaines d'unités. Une cadence de 1 robot toutes les 15 minutes, si elle est confirmée en régime nominal et non seulement revendiquée en pic de démo, constituerait une rupture dans le ratio coût/volume. Elle valide aussi l'hypothèse que le goulot d'étranglement de la filière n'est plus uniquement logiciel (contrôleurs, VLA, sim-to-real), mais bien industriel. Pour les intégrateurs et décideurs B2B, cela change le calcul : la question n'est plus "aura-t-on accès à des robots ?" mais "à quel prix et avec quel support ?" La précision des 79 points de contrôle et 46 tests de simulation suggère une démarche sérieuse de standardisation, même si ENGINEAI n'a pas publié de données indépendantes sur les taux de défauts ou la fiabilité terrain. ENGINEAI s'inscrit dans une vague d'industriels chinois qui accélèrent sur l'humanoïde depuis 2024, portés par des politiques publiques favorables et une base de fournisseurs actuateurs/capteurs mature dans la région de Shenzhen. La société commercialise quatre plateformes : le T800 (humanoïde lourd), le PM01 (humanoïde généraliste), le SA02 (robot compagnon léger) et le JS01 (quadrupède). Ses cibles déclarées sont l'industrie et l'inspection, soit les mêmes segments qu'Agility Robotics (Digit, déployé chez Amazon), Figure (accord BMW), Unitree ou Fourier Intelligence. Sur le plan concurrentiel, la proximité géographique avec les fournisseurs de la chaîne d'approvisionnement shenzhenoise constitue un avantage structurel face aux acteurs américains. Les prochaines étapes annoncées incluent la montée en puissance du site de Zhengzhou et l'atteinte du seuil des 10 000 unités cumulées, sans calendrier précis communiqué à ce stade.

UELa montée en capacité industrielle cadencée de la filière humanoïde chinoise accentue la pression sur les intégrateurs et constructeurs européens (ABB, KUKA, Stäubli) : si les chiffres se confirment en régime nominal, le ratio coût/volume change structurellement et les décideurs B2B européens devront revoir leurs calculs de TCO pour leurs lignes de production d'ici 2027.

Chine/AsieOpinion
1 source
Guide complet des événements du Robotics Summit & Expo 2026
31The Robot Report 

Guide complet des événements du Robotics Summit & Expo 2026

Le Robotics Summit & Expo 2026 ouvre ses portes le 27 mai à Boston, au Thomas M. Menino Convention & Exhibition Center. L'événement réunit plus de 5 000 experts de la robotique et 200 exposants sur deux jours, avec plus de 50 sessions réparties en cinq tracks : intelligence artificielle, design et développement, technologies habilitantes, santé et logistique. Plus de 70 intervenants représentent des acteurs comme Amazon Robotics, Universal Robots, Locus Robotics, Boston Dynamics, Agility, Tesla, le Toyota Research Institute, Harmonic Drive, maxon, PickNik Robotics et Intrinsic. La première journée s'ouvre à 9h par le panel "Building the Next Era of Robot Autonomy", avec Aaron Parness (directeur de la science appliquée chez Amazon Robotics), Anders Beck (VP produits AI robotics chez Universal Robots), Hamid Montazeri (SVP software et IA chez Locus Robotics) et John Wall (président de QNX). À 10h suivra le panel "The State of Humanoids", incluant Alberto Rodriguez (directeur du comportement robot pour Atlas chez Boston Dynamics) et Pras Velagapudi (CTO d'Agility Robotics). Le 28 mai, Brian Gerkey (board chair d'Open Robotics et CTO d'Intrinsic) livrera la keynote "An Open Foundation for the Age of AI-Powered Robots", et la conférence se clôturera par le témoignage de Noland Arbaugh, premier utilisateur d'un implant cérébral Neuralink. La concentration de sessions de haut niveau sur l'autonomie et les humanoïdes reflète le basculement du secteur d'une phase de démonstration vers une phase de commercialisation active. La présence d'Alberto Rodriguez (Boston Dynamics) et de Pras Velagapudi (Agility) sur le même panel humanoïde est révélatrice : ces deux entreprises sont actuellement les seules à pouvoir revendiquer des déploiements clients documentés à échelle industrielle, et leur coprésence sur scène illustre une compétition directe pour les contrats pilotes. Le thème porté par Gerkey (Intrinsic, filiale Alphabet) sur les fondations logicielles ouvertes pour robots IA pointe une tension structurelle du secteur : la fragmentation des stacks ROS freine l'interopérabilité, et plusieurs acteurs cherchent à imposer un middleware de référence avant que le marché ne se verrouille autour d'un standard propriétaire. Le Robotics Summit est organisé par The Robot Report et Peerless Media, et constitue l'un des deux grands rendez-vous professionnels de la robotique aux États-Unis avec RoboBusiness. L'édition 2026 se tient dans un contexte de forte pression concurrentielle sur le segment humanoïde : Figure AI, 1X, Apptronik, Unitree et Fourier Intelligence ont multiplié les annonces depuis dix-huit mois, tandis que les déploiements réels documentés restent rares. L'absence dans le programme de représentants de Figure AI ou de 1X peut indiquer un positionnement délibéré de ces acteurs en dehors des canaux de conférence traditionnels, ou simplement un agenda non finalisé. Les RBR50 Innovation Awards, remis lors du dîner du soir du 27 mai, constitueront un baromètre utile des projets jugés les plus significatifs par la communauté professionnelle cette année.

Étude de l'effet d'un retrofit à actionnement élastique en série sur des actionneurs boîte noire
32arXiv cs.RO 

Étude de l'effet d'un retrofit à actionnement élastique en série sur des actionneurs boîte noire

Des chercheurs ont publié sur arXiv (référence 2605.24127, mai 2026) les résultats d'une étude portant sur le retrofit d'un élément élastique en série (SEA, Series Elastic Actuation) sur un actionneur dit "boîte noire", c'est-à-dire un actionneur commercial dont les paramètres internes sont inaccessibles. L'élément élastique torsionnel a été dimensionné par analyse en éléments finis (FE analysis), aboutissant à une raideur de 2 155,4 Nm/rad. Le résultat principal est une amélioration de la bande passante en contrôle d'effort en boucle ouverte, passant de 10,32 Hz pour le moteur seul à 30,32 Hz avec le module SEA intégré, soit un gain de 2,93x. En boucle fermée, le module surpasse un capteur d'effort commercial de 7,63%, pour un coût matière de seulement 25 GBP. Ce résultat a une portée directe pour les intégrateurs robotiques confrontés à des actionneurs industriels standard dont ils ne maîtrisent pas la couche logicielle basse. Les actionneurs rigides à faible jeu mécanique sont omniprésents en robotique industrielle précisément parce qu'ils garantissent répétabilité et précision, mais ils sont inadaptés dès que la tâche exige du contrôle d'effort ou une compliance face à des contacts incertains. Le principe SEA, qui insère un ressort entre le moteur et la charge pour mesurer les efforts via la loi de Hooke, est connu depuis les travaux de Gill Pratt au MIT dans les années 1990, mais son application reste généralement cantonnée aux plateformes conçues pour l'accepter dès l'origine. Ce travail démontre qu'un retrofit peu coûteux peut débloquer la mesure d'effort haute fidélité sans remplacer l'actionneur existant. L'approche s'inscrit dans un courant de recherche actif autour de la compliance en actionnement, qui irrigue aussi bien les robots humanoïdes (Boston Dynamics Atlas, Agility Digit, Figure 02) que les exosquelettes et cobots collaboratifs. Les concurrents directs de cette approche incluent le quasi-direct drive (QDD), popularisé par MIT Cheetah et repris chez nombre de fabricants chinois (Unitree, Fourier Intelligence), ainsi que les capteurs d'effort six axes montés en poignet. La limite principale du SEA reste la réduction de bande passante, que ce travail atténue mais ne supprime pas entièrement. Les prochaines étapes logiques concerneraient des validations sur tâches manipulatoires réelles et une caractérisation de la durée de vie mécanique de l'élément élastique retrofit dans des cycles répétitifs.

RecherchePaper
1 source
Les robots humanoïdes de Figure atteignent 200 heures de travail et 250 000 colis traités sans défaillance
33Interesting Engineering 

Les robots humanoïdes de Figure atteignent 200 heures de travail et 250 000 colis traités sans défaillance

Figure AI, startup californienne valorisée 39 milliards de dollars, a mené à son terme un test d'endurance de 200 heures consécutives avec trois de ses robots humanoïdes Figure 03, pilotés par son système d'IA Helix-02. Lancée le 14 mai 2026 depuis le siège de Sunnyvale en Californie, l'opération a permis de trier 249 560 colis sur des tapis roulants, sans défaillance matérielle majeure constatée sur aucune des trois unités, baptisées Bob, Jim et Rose par les spectateurs du livestream. Le test avait été initié en réponse à un défi de 8 heures formulé par le Dr Scott Walter, vétéran de l'automatisation industrielle, avant d'être prolongé sans limite préétablie. Les robots utilisaient des caméras embarquées et un raisonnement IA pour détecter les codes-barres, saisir les colis et les déposer face code-barres vers le bas sur les convoyeurs. La cadence atteinte approche les trois secondes par colis, soit la parité estimée avec un opérateur humain. La rotation de flotte était entièrement autonome : lorsque la batterie d'un robot (autonomie d'environ quatre heures) atteignait un seuil critique, une unité de relève prenait automatiquement sa place pendant que le robot déchargé rejoignait une station de recharge sans fil intégrée à la plante de ses pieds. Des erreurs de manipulation ont néanmoins été observées, colis tombés ou mal orientés, que Figure AI distingue explicitement des pannes système. Ce test de 200 heures constitue un signal concret pour les intégrateurs et les décideurs industriels : une flotte d'humanoïdes peut enchaîner plusieurs jours d'opération continue sans intervention humaine corrective, à condition de disposer d'un système de rotation et de remplacement automatisé. La capacité d'auto-éviction est particulièrement notable : si un robot détecte une anomalie matérielle ou logicielle, il navigue de façon autonome vers une zone de service pendant qu'un autre prend le relais sans interruption du flux. Helix-02 est décrit par Figure AI comme un réseau de neurones unifié intégrant vision, toucher, proprioception et contrôle du corps entier dans un seul modèle, à l'opposé des architectures modulaires classiques qui séparent locomotion et manipulation. Ce choix d'architecture VLA (Vision-Language-Action) montre des résultats à l'échelle des 200 heures, mais le test s'est déroulé dans les locaux contrôlés de Figure AI et non chez un client en production, ce qui atténue la portée des conclusions. Figure AI avait déjà conduit des validations en environnement industriel réel, notamment dans les usines BMW de Caroline du Sud. La société concourt directement face à Tesla (Optimus), Agility Robotics (Digit, déployé chez Amazon) et Apptronik (Apollo, partenaire de NASA et Mercedes-Benz), tous engagés dans la commercialisation d'humanoïdes pour la logistique et la production manufacturière. En Europe, des acteurs comme Enchanted Tools (Mirokaï) et Wandercraft restent positionnés sur des segments différents, retail hospitalier et rééducation médicale, loin des volumes logistiques visés par les acteurs américains. La prochaine étape structurante pour Figure AI sera de reproduire ces métriques hors de ses propres installations, dans des environnements clients réels, seul véritable test du passage de la démonstration au déploiement industriel.

UELa démonstration amplifie l'écart technologique entre les acteurs américains et les acteurs européens sur le segment logistique humanoïde, sans impact opérationnel direct sur la France ou l'UE à court terme.

HumanoïdesOpinion
1 source
Les robots humanoïdes entrent dans l'industrie manufacturière : vers de nouvelles forces productives
3436Kr 

Les robots humanoïdes entrent dans l'industrie manufacturière : vers de nouvelles forces productives

UBTECH (优必选), fabricant chinois de robots humanoïdes fondé il y a 14 ans, a franchi en 2025 un jalon industriel concret : l'entreprise affirme avoir été la première au monde à atteindre la production en série et la livraison de plus de 1 000 unités de robots humanoïdes pleine taille, avec sa gamme Walker S. L'objectif annoncé pour 2026 est de 10 000 unités produites, ce qui, selon Tan Min, Chief Brand Officer de l'entreprise, représenterait encore une fraction infime du besoin réel. Le ministère chinois des Ressources humaines, celui de l'Education et celui de l'Industrie ont publié en 2025 un chiffre commun : le déficit de main-d'oeuvre dans le secteur de la fabrication intelligente dépasse 30 millions de postes en Chine. Le Walker S2, troisième génération de la plateforme, intègre une technologie de remplacement de batterie en 3 minutes sans arrêt de production, présentée par l'entreprise comme une première mondiale, sans comparatif tiers disponible pour l'instant. UBTECH travaille avec des partenaires industriels incluant Texas Instruments (États-Unis), Airbus (Europe), Honda Trading (Japon) et BYD (Chine), avec plus de 24 mois de POC (proof of concept) accumulés sur ces sites. L'argument central d'UBTECH n'est pas la performance technique brute mais l'adéquation au besoin opérationnel : des tâches répétitives, à faible complexité sensorimotrice, dans des espaces restreints, sans opération de précision. Le segment ciblé correspond exactement aux postes les plus difficiles à pourvoir dans les usines chinoises, ce qui rend l'argument commercial plus solide que celui de la substitution généralisée. Le fait qu'une entreprise atteigne le seuil de 1 000 unités livrées en conditions industrielles réelles, et non en démo contrôlée, est significatif dans un secteur où la plupart des concurrents en sont encore aux phases pilotes ou aux vidéos de laboratoire. Cela ne résout pas la question du "sim-to-real gap" à grande échelle, mais c'est un point de référence mesurable que le marché attendait. UBTECH existe depuis 2012 et a longtemps dû justifier l'existence même de la catégorie "robot humanoïde industriel". La compétition sur ce segment s'est considérablement intensifiée : Figure (Figure 02/03), Boston Dynamics (Atlas électrique), Tesla (Optimus Gen 2/3), Agility Robotics (Digit, déployé chez Amazon), 1X Technologies, ainsi qu'une centaine d'autres entreprises chinoises. La Chine a inscrit les robots humanoïdes dans son 15e plan quinquennal (2026-2030) comme priorité nationale, et plusieurs villes dont Pékin et Shanghai y consacrent des budgets dédiés. UBTECH se positionne aujourd'hui à la quatrième année d'un plan quinquennal interne, avec pour objectif d'atteindre une vraie industrialisation à grande échelle d'ici 2027-2028 et une présence en environnements commerciaux puis domestiques dans un second temps.

UEAirbus est cité comme partenaire actif d'UBTECH avec plus de 24 mois de POC, indiquant que des humanoïdes industriels chinois sont déjà testés dans l'écosystème aéronautique franco-européen.

HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique
35arXiv cs.RO 

HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique

Des chercheurs ont présenté sur arXiv (2602.03205) HUSKY, un framework permettant à l'humanoïde Unitree G1 de faire du skateboard de manière stable en conditions réelles. Un skateboard est une plateforme sous-actionnée soumise à des contraintes non-holonomes (le véhicule ne se déplace pas librement dans toutes les directions) dont l'inclinaison est mécaniquement couplée à l'orientation des trucks. HUSKY modélise ce couplage et décompose la tâche en deux phases : poussée du pied au sol et direction par inclinaison du corps (lean-to-steer), reliées par un mécanisme de transition guidé par trajectoire. Les mouvements de poussée sont appris via les Adversarial Motion Priors (AMP), une technique d'imitation générant des gestes naturels à partir de données de référence. Les tests sur le G1 démontrent une navigation agile en environnement réel. Ce travail pointe une limite structurelle des frameworks de contrôle whole-body actuels : ils supposent quasi-unanimement un sol statique et des contacts prévisibles. En modélisant la dynamique du couplage humain-objet, HUSKY montre qu'un humanoïde peut opérer sur un équipement mobile non conventionnel sans recalibration manuelle, ce qui ouvre la voie à des robots capables de manouvrer chariots ou palettes en environnement industriel. L'association d'un modèle physique du sous-système mécanique avec l'apprentissage par imitation constitue une approche plus robuste que les politiques entraînées en simulation pure, et le transfert sim-to-real semble validé sur un scénario concret. Les conditions précises des tests (vitesse, distance, taux d'échec) ne sont pas détaillées dans l'article, ce qui limite l'évaluation objective des performances annoncées. Le Unitree G1, humanoïde à 43 degrés de liberté vendu autour de 16 000 dollars, s'impose comme plateforme de référence pour la recherche en locomotion avancée aux côtés du Boston Dynamics Atlas et de l'Agility Digit. En 2025-2026, la recherche en contrôle whole-body dynamique s'accélère avec Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) et les politiques loco-manipulation développées à Carnegie Mellon. HUSKY se distingue en explorant le couplage avec des véhicules sous-actionnés plutôt que la manipulation d'objets statiques. Il s'agit pour l'instant d'une démonstration de recherche sans déploiement industriel annoncé, et les étapes suivantes naturelles incluent l'extension à d'autres véhicules (trottinette, vélo) ou des scénarios combinant locomotion et manipulation.

RecherchePaper
1 source
FANUC s'associe à Google pour développer l'IA physique dans ses robots
36Robotics Business Review 

FANUC s'associe à Google pour développer l'IA physique dans ses robots

FANUC Corp. a annoncé cette semaine un partenariat stratégique avec Google visant à accélérer le déploiement de l'IA physique dans ses robots industriels. L'initiative s'appuie sur les technologies d'intelligence artificielle de Google, notamment les grands modèles de langage (LLM), pour doter les robots FANUC de capacités de perception environnementale, de prise de décision autonome et d'exécution adaptative. Mike Cicco, président et CEO de FANUC America, a résumé l'enjeu sans détour : "Les fabricants ne se demandent plus s'ils doivent utiliser l'IA, mais comment l'appliquer là où ça compte le plus, soit sur le sol de l'usine." Depuis la présentation de son système d'IA physique à l'IREX de Tokyo en décembre 2025, FANUC affirme avoir déjà expédié plus de 1 000 robots pour des applications liées à l'IA physique, une donnée qui distingue ce partenariat d'une simple annonce commerciale. La gamme concernée s'étend des petits bras avec une charge utile de 3 kg jusqu'aux robots industriels lourds supportant 2 300 kg, ainsi que la série collaborative CRX. Sur le plan technique, la compatibilité de FANUC avec le standard ROS (Robot Operating System) via des pilotes open-source constitue le socle de l'intégration. La société prend en charge le langage Python pour le développement IA, des interfaces de communication haute vitesse pour le contrôle externe, et des passerelles vers les automates programmables (PLC), ce qui facilite l'insertion dans des lignes de production existantes sans refonte d'architecture. En parallèle, FANUC annonce un resserrement de l'intégration entre son logiciel de simulation ROBOGUIDE et le framework NVIDIA Isaac Sim, un signal fort vers le sim-to-real, l'un des verrous techniques majeurs de la robotique adaptative. Pour les intégrateurs et les décideurs industriels, ce positionnement signifie que les outils IA grand public deviennent directement utilisables sur des cellules robotisées certifiées production, ce qui réduit significativement la distance entre prototype et déploiement réel. FANUC, fondée au Japon et dont la filiale américaine est basée à Rochester Hills, Michigan, est l'un des leaders mondiaux du contrôle numérique (CNC) et de la robotique industrielle, avec des implantations sur tout le continent américain. Google s'implique dans la robotique principalement via Intrinsic, son unité dédiée à l'IA robotique et l'un des contributeurs majeurs à l'écosystème ROS. Ce partenariat positionne les deux acteurs dans une course qui s'intensifie entre les fournisseurs de robots industriels traditionnels (ABB, KUKA, Yaskawa) et les nouveaux entrants humanoïdes comme Figure ou Agility Robotics, qui misent eux aussi sur des LLM pour la flexibilité d'exécution. FANUC, fort de 1 000 unités déjà expédiées, cherche à démontrer que l'IA physique n'est plus un sujet de R&D mais une réalité commerciale intégrable à grande échelle. Les prochaines démonstrations sont attendues au Robotics Summit & Expo de Boston dans les prochains jours.

UEPression concurrentielle directe sur ABB et KUKA face à un déploiement LLM-robotique industrielle désormais à échelle commerciale chez FANUC (1 000 unités expédiées), accélérant la course à l'IA physique dans l'industrie manufacturière européenne.

IndustrielOpinion
1 source
Sélectionner ou ne pas sélectionner : distillation de la prédiction de compétences robotiques en petit ensemble
37arXiv cs.RO 

Sélectionner ou ne pas sélectionner : distillation de la prédiction de compétences robotiques en petit ensemble

Une équipe de chercheurs publie en mai 2026 un preprint (arXiv:2605.21242) portant sur la prédiction automatique de compétences robotiques dans les flottes hétérogènes. À partir d'une description de tâche en langage naturel, le système identifie quelles capacités physiques sont requises parmi six catégories: vol, roues, pattes, navigation en surface aquatique, navigation sous-marine et manipulation avec mains. Faute de données labellisées existantes pour ce mapping, les auteurs ont construit un dataset synthétique via génération assistée par LLM et audit ciblé des étiquettes. Un ensemble de deux encodeurs de phrases fine-tunés (mpnet + MiniLM, environ 133 millions de paramètres au total) atteint 83,5 % de précision sur un jeu de test stratifié de 200 tâches, dépassant Kimi K2 (1 000 milliards de paramètres, architecture MoE) à 72,0 %, GPT-OSS-120B à 71,5 %, et Llama-4-Scout-17B à 69,0 %, tous évalués en zero-shot avec le même prompt. Ce résultat expose une asymétrie opérationnelle significative: un modèle de 133 millions de paramètres déployable localement surclasse des LLMs un millier de fois plus volumineux sur une tâche de routage de flotte. Pour les intégrateurs gérant des flottes mixtes (humanoïdes, quadrupèdes, drones, rovers), l'assignation automatique de la bonne plateforme à la bonne tâche reste un problème non résolu en production. Une limite mérite d'être soulignée: le jeu d'évaluation de 200 tâches synthétiques a été produit par les auteurs eux-mêmes, ce qui appelle une validation indépendante sur des scénarios réels avant de tirer des conclusions définitives. La gestion de flottes robotiques hétérogènes s'est intensifiée avec la multiplication des plateformes commerciales (Boston Dynamics Spot, Unitree B2, humanoïdes Figure ou Agility Digit, drones industriels), et les approches actuelles de routage reposent encore sur des règles manuelles peu scalables. Les auteurs s'inscrivent dans la tendance de distillation de capacités LLM vers des modèles compacts (famille SetFit, sentence-transformers), appliquée ici pour la première fois à la sélection de plateforme robotique. Ce preprint ne mentionne ni déploiement terrain ni partenariat industriel, mais l'utilisation de mpnet et MiniLM, disponibles en open-source sur Hugging Face, abaisse la barrière à une validation industrielle rapide.

RecherchePaper
1 source
Hyundai étend sa stratégie robotique aux États-Unis avec un déploiement de 25 000 robots humanoïdes Atlas
38Interesting Engineering 

Hyundai étend sa stratégie robotique aux États-Unis avec un déploiement de 25 000 robots humanoïdes Atlas

Hyundai Motor Group prévoit de déployer plus de 25 000 robots humanoïdes Atlas, développés par sa filiale Boston Dynamics, dans les usines de Hyundai Motor et Kia aux États-Unis. L'annonce a été faite lors d'une session organisée par JPMorgan Chase. Le groupe vise une capacité de production annuelle de 30 000 unités Atlas d'ici 2028, avec la fabrication locale de plus de 300 000 actionneurs par an, les composants qui font office d'articulations mécaniques. Le PDG de Kia Corporation, Song Ho-sung, a précisé lors de road shows que les premiers Atlas devraient entrer en service au Hyundai Motor Group Metaplant America en Géorgie en 2028, puis à l'usine Kia de Géorgie en 2029. Aucun calendrier détaillé par site ni liste de factories prioritaires n'a été communiqué. En parallèle, Boston Dynamics a publié un billet technique détaillant comment Atlas manipule des objets industriels lourds : le robot pivote son torse à 180 degrés, s'accroupit pour saisir un mini-réfrigérateur et le transporte en compensant dynamiquement les déplacements de masse interne. Cette capacité a été développée en quelques semaines via apprentissage par renforcement sur des millions d'heures de simulation GPU en parallèle. Ces chiffres représentent le déploiement humanoïde annoncé le plus ambitieux dans l'industrie automobile à ce jour. La production d'actionneurs en volume suggère une intégration verticale qui pourrait compresser les coûts unitaires sur le long terme. Sur le plan technique, l'approche de Boston Dynamics repose principalement sur la proprioception, c'est-à-dire la conscience interne du mouvement et des forces corporelles, plutôt que sur des systèmes de vision dominants, ce qui diverge des architectures VLA (Vision-Language-Action) adoptées par des concurrents comme Physical Intelligence avec son modèle pi-0 ou Figure AI. L'entreprise affirme avoir réduit le "sim-to-real gap" via une architecture simplifiée à deux types d'actionneurs seulement et des membres symétriques, améliorant la fidélité entre simulation et comportement physique réel. Si cette réduction se confirme en production, cela constituera un argument technique fort face à des plateformes plus complexes comme Tesla Optimus Gen 3 ou Apptronik Apollo. Boston Dynamics a présenté la version entièrement électrique d'Atlas en avril 2024, mettant fin à la plateforme hydraulique exploitée depuis 2013. Hyundai avait racheté l'entreprise à SoftBank en 2021 pour environ 1,1 milliard de dollars. L'annonce intervient dans une course industrielle intense : Tesla vise une production de masse d'Optimus, Figure AI a levé 675 millions de dollars pour son robot Figure 02, et Agility Robotics, propriété d'Amazon, déploie son Digit dans des entrepôts logistiques. En Europe, les acteurs restent à des stades plus précoces : Enchanted Tools à Paris développe Miroki pour la logistique hospitalière, tandis que Wandercraft se concentre sur les exosquelettes médicaux. Les prochaines étapes pour HMG incluent la confirmation des sites pilotes et le démarrage effectif des lignes de production d'actionneurs aux États-Unis, deux éléments qui permettront de distinguer l'annonce commerciale du déploiement réel.

UEL'annonce renforce la pression concurrentielle sur les acteurs européens comme Enchanted Tools et Wandercraft, qui restent à des stades de développement bien antérieurs à ce déploiement industriel à grande échelle.

HumanoïdesOpinion
1 source
La sécurité des robots domestiques repose avant tout sur la relation humain-machine
39IEEE Spectrum Robotics 

La sécurité des robots domestiques repose avant tout sur la relation humain-machine

L'Organisation internationale de normalisation (ISO) révise ISO 13482, sa norme de sécurité pour les robots de soin personnel, vieille de douze ans. La mise à jour est actuellement en phase d'approbation finale. Elle couvre l'identification des dangers, l'évaluation des risques et différents scénarios d'utilisation, mais n'établit ni seuils contraignants, ni méthodes de test, ni mécanismes d'application pour les risques liés à l'interaction humain-robot. C'est précisément ce manque que dénonce Jae-Seong Lee, chercheur en politique technologique à l'Electronics and Telecommunications Research Institute de Daejeon (Corée du Sud), dans une interview accordée à IEEE Spectrum. La norme entre en phase finale au moment où les fabricants d'humanoïdes domestiques basculent des prototypes de laboratoire vers des produits destinés à de vraies maisons, de vrais aidants et de vraies familles. Le problème central identifié par Lee est autant conceptuel que technique : la sécurité d'un robot domestique n'est pas une propriété fixe de la machine, elle émerge de la relation entre le robot et l'humain. L'interaction est bidirectionnelle, le robot modifie le comportement de l'humain, et l'humain modifie ce que le robot perçoit et décide ensuite. Les normes industrielles classiques peuvent borner la tâche, l'espace de travail et la population concernée. Dans un domicile, le robot doit s'adapter à des personnes âgées, des enfants, des visiteurs, des animaux, du désordre et des espaces confinés. Ce ne sont pas des cas marginaux : c'est le cadre opérationnel de base. Contraindre l'enveloppe d'un humanoïde domestique pour la rapprocher d'un robot industriel reviendrait à annuler son utilité. Par ailleurs, les entreprises qui constituent les jeux de données d'entraînement envoient déjà des travailleurs salariés filmer leurs tâches quotidiennes dans des logements ordinaires à travers le monde, ancrant la variabilité réelle du terrain dans les modèles. Le problème de sécurité se situe donc au niveau du système humain-robot complet, pas d'un composant isolé. ISO 13482 avait été publiée en 2014, dans un contexte où les robots de soin se limitaient à des assistants de mobilité et des plateformes relativement simples. Douze ans plus tard, des acteurs comme Figure AI, Boston Dynamics, 1X ou Agility Robotics positionnent des humanoïdes polyvalents comme prochaine étape du travail domestique et du maintien à domicile. En Europe, des entreprises comme Enchanted Tools avec son Mirokaï ou Wandercraft évoluent dans des environnements réglementaires similaires, ce qui leur confère une exposition directe à ce vide normatif. Le déficit identifié par Lee est avant tout un déficit de gouvernance : la communauté technique comprend le couplage bidirectionnel, le cadre normatif reconnaît les dangers associés, mais aucune norme ne traduit aujourd'hui cette compréhension en règles applicables pour l'autonomie domestique. Une question reste aussi ouverte : qui décide quel comportement humain est "normal" ? Quelle démarche sert de référence, et quel seuil de risque est acceptable pour une personne âgée à mobilité réduite par rapport à un adulte valide ? Sans réponse à ces questions, la prochaine génération de robots domestiques arrivera sur le marché sans cadre de sécurité adapté à sa réalité opérationnelle.

UEEnchanted Tools (Mirokaï) et Wandercraft sont explicitement cités comme directement exposés au vide normatif d'ISO 13482, qui n'impose aucun seuil contraignant ni méthode de test pour l'autonomie domestique.

RegulationReglementation
1 source
Marche, course et récupération unifiées pour robots humanoïdes via des priors de mouvement adversariaux adaptatifs
40arXiv cs.RO 

Marche, course et récupération unifiées pour robots humanoïdes via des priors de mouvement adversariaux adaptatifs

Une équipe de chercheurs a publié fin mai 2026 sur arXiv (arXiv:2605.18611) un framework d'apprentissage par renforcement unifié permettant à un seul contrôleur de faire marcher, courir et se relever après une chute le robot humanoïde Unitree G1, sans commande explicite de changement de mode au déploiement. L'approche étend les Adversarial Motion Priors (AMP) en remplaçant la distribution de référence globale par un mécanisme de routage conditionné à l'état : un seuil fixe sur la gravité projetée (|gz+1| > 0,6, soit environ 37° d'inclinaison du torse par rapport à la verticale) aiguille chaque transition d'entraînement soit vers un discriminateur dédié à la récupération, soit vers un discriminateur de locomotion conditionné par la vitesse commandée, qui couvre à la fois la marche et la course. Seuls trois clips de motion capture extraits du jeu de données LAFAN1 sont nécessaires pour régulariser l'ensemble du comportement. Sur hardware réel, la politique tourne à 50 Hz sous forme d'un fichier ONNX figé, sans aucune logique de mode à l'exécution, et valide des relevés réussis depuis les positions ventrale et dorsale ainsi que des transitions fluides marche-course. Ce résultat s'attaque directement à un problème d'intégration récurrent dans la robotique humanoïde commerciale : la fragmentation en contrôleurs spécialisés par mode, reliés par des automates à états qui génèrent des zones de transition fragiles et coûteuses à maintenir. Démontrer qu'une politique apprise par RL couvre ces régimes de façon continue sur hardware réel, et non uniquement en simulation, affaiblit l'argument du sim-to-real gap rédhibitoire pour les comportements complexes. Le coût d'annotation est lui aussi remarquablement bas : trois clips de reference suffisent là où d'autres travaux en exigent des dizaines, ce qui rend la méthode potentiellement transférable à d'autres plateformes avec un effort de données limité, qu'il s'agisse du PAL Robotics TALOS, du MIROKAÏ d'Enchanted Tools, ou de tout humanoïde léger à faible budget de motion capture. La publication s'inscrit dans une course dense à la locomotion humanoïde robuste, où Boston Dynamics (Atlas), Figure (Figure 03), Agility Robotics (Digit) et Tesla (Optimus Gen 3) investissent massivement, mais publient peu. Sur le plan académique, des approches concurrentes comme les VLA (Vision-Language-Action models) de Physical Intelligence ou les travaux de Berkeley visent des politiques encore plus générales, mais sacrifient souvent la robustesse physique au profit de la flexibilité sémantique. L'utilisation du Unitree G1, disponible à environ 16 000 dollars et largement répandu dans les laboratoires, confère à ces travaux une reproductibilité pratique supérieure aux publications sur plateformes fermées. L'article ne précise pas de timeline de déploiement industriel, mais la compatibilité ONNX et l'absence de logique embarquée à l'exécution réduisent la barrière à l'intégration pour un OEM ou un intégrateur souhaitant évaluer la méthode sur sa propre plateforme.

UELa méthode, compatible ONNX et nécessitant seulement 3 clips de motion capture, est explicitement identifiée comme transférable au MIROKAÏ d'Enchanted Tools (FR) et au TALOS de PAL Robotics (EU), réduisant le coût d'adaptation pour les équipes de recherche et les intégrateurs européens.

RecherchePaper
1 source
Les robots ont-ils vraiment besoin de mains anthropomorphiques ? Comparaison entre mains humaines et robotiques
41arXiv cs.RO 

Les robots ont-ils vraiment besoin de mains anthropomorphiques ? Comparaison entre mains humaines et robotiques

Une revue systématique publiée sur arXiv (2508.05415) pose une question directe : les robots ont-ils vraiment besoin de mains anthropomorphes ? Après analyse de 125 articles scientifiques couvrant 2019 à 2025, les auteurs concluent que les mains à cinq doigts, souvent présentées comme l'objectif ultime de la manipulation robotique, ne sont pas nécessaires pour la majorité des tâches. En comparant les propriétés biomécaniques de la main humaine (degrés de liberté, capteurs cutanés, contrôle moteur) avec les mains robotiques commerciales disponibles aujourd'hui, ils montrent que la complexité mécanique ne se traduit pas systématiquement par une meilleure dextérité pour la manipulation en main (in-hand manipulation). Des mécanismes à deux ou trois doigts se révèlent souvent aussi efficaces pour des applications industrielles ciblées. Pour les intégrateurs et les décideurs industriels, ce résultat remet en cause une hypothèse répandue : reproduire la morphologie humaine ne garantit pas des performances humaines. La revue établit qu'une main à cinq doigts augmente l'étendue des tâches réalisables, mais apporte peu d'avantage pour la manipulation fine d'objets déjà saisis. Plus significatif encore, l'intégration de capteurs et les stratégies de manipulation intelligentes restent sous-exploitées dans la littérature, car la recherche se concentre sur la réplication du nombre de doigts et des DOF plutôt que sur la robustesse mécanique et la compliance. Les auteurs soulignent que des mains plus souples et robustes permettraient un meilleur apprentissage par contact environnemental et une intégration plus dense de capteurs, deux leviers actuellement sacrifiés au profit de l'esthétique biomimétique. Cette remise en question survient dans un contexte de course au design anthropomorphe, portée par les humanoïdes de Figure (Figure 03), Tesla (Optimus Gen 3), 1X Technologies et Agility Robotics, dont les mains à cinq doigts sont systématiquement mises en avant dans les communications marketing. La question n'est pourtant pas nouvelle : les grippers industriels bi-digitaux de Robotiq, OnRobot et Schunk dominent les lignes d'assemblage depuis des années. L'accumulation de preuves empiriques sur 125 publications donne à cet argument une base scientifique que les annonces de lancement ne pouvaient pas offrir. Les auteurs plaident pour des critères d'évaluation standardisés, un manque criant alors que chaque laboratoire définit ses propres benchmarks, condition nécessaire pour que le secteur sorte du cycle annonce/démo et entre dans une phase d'industrialisation mesurable.

UELes conclusions valident empiriquement l'approche des fabricants de grippers industriels européens comme Schunk (DE) et OnRobot (DK), dont les solutions bi/tri-digitales dominent les lignes d'assemblage face à la tendance anthropomorphe des humanoïdes américains.

RecherchePaper
1 source
Amélioration des capacités des robots manipulateurs collaboratifs par algorithme de tâches
42arXiv cs.RO 

Amélioration des capacités des robots manipulateurs collaboratifs par algorithme de tâches

Des chercheurs ont soumis le 22 mai 2026 sur arXiv (réf. 2605.17293) un algorithme baptisé Task Capability Improvement Algorithm (TCIA), conçu pour les systèmes de manipulation collaborative multi-bras. Le principe central repose sur l'exploitation de moments résiduels, des couples non désirés qui émergent naturellement lorsque des bras robotiques appliquent des forces en un point de préhension différent du centre de gravité de l'objet. Plutôt que de les compenser (l'approche classique), l'algorithme les redirige comme levier d'amélioration de capacité. Les simulations présentées montrent un gain de 5,86 % sur la capacité de tâche globale du groupe de manipulateurs, comparé à une configuration sans exploitation de ces moments. Aucune validation expérimentale sur matériel réel n'est encore présentée à ce stade. Ce résultat, modeste en valeur absolue, est néanmoins pertinent pour les applications industrielles de manipulation lourde ou de transport d'objets en configuration multi-bras. L'algorithme permet simultanément d'optimiser la capacité globale du groupe, l'allocation des ressources entre les bras (distribution de charge, couple disponible par actionneur) et la tolérance aux pannes, soit la capacité du système à maintenir une tâche malgré la défaillance d'un bras. Pour un intégrateur travaillant sur des cellules collaboratives, cette triple optimisation via un seul mécanisme représente un avantage de conception concret. L'approche inverse la logique habituelle : ce qui était traité comme une perturbation physique devient une ressource exploitable. La manipulation coopérative multi-bras est un domaine actif depuis les années 1990, mais l'intérêt s'est intensifié avec la montée des cobots deux bras (Universal Robots, FANUC CRX, KUKA iiwa en configuration duale) et des humanoïdes comme Figure 03, Apptronik Apollo ou Agility Digit, qui doivent manipuler des objets volumineux sans gabarit dédié. L'approche TCIA s'inscrit dans une tendance plus large d'exploitation des contraintes physiques comme ressources plutôt que comme nuisances. Les suites naturelles seraient une validation sur banc physique et une extension aux configurations à géométrie variable, notamment les systèmes mobiles où le point de préhension évolue dynamiquement pendant la tâche.

RecherchePaper
1 source
Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée
43Interesting Engineering 

Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée

Menlo Research, une startup basée à Singapour, a lancé un kit de construction pour son robot humanoïde open-source Asimov, vendu environ 15 000 dollars, soit un prix proche du coût réel de ses composants selon la liste publiée sur GitHub. Le robot mesure 1,20 mètre, pèse 35 kilogrammes et dispose de plus de 25 degrés de liberté. Livré entièrement démonté, avec manuels et vidéos de montage, il cible chercheurs, développeurs et hobbyistes avancés. L'architecture est entièrement modulaire : jambes, bras, torse et tête s'interconnectent via des fixations moteur universelles, permettant le remplacement ou la mise à niveau de composants sans refonte globale. La cheville utilise un mécanisme parallèle RSU (Revolute-Spherical-Universal) à deux degrés de liberté (roulis et tangage), améliorant la distribution du couple sur terrain irrégulier. Les orteils sont passifs (non actionnés), simplifiant la transition appui-poussée et réduisant la charge calculatoire. Les pièces structurelles sont optimisées pour l'impression 3D Multi Jet Fusion (MJF), éliminant le recours à l'usinage CNC coûteux. Côté logiciel, l'entraînement repose sur une approche "Processor-in-the-Loop" (PIL) qui injecte délibérément des imperfections réalistes : latences CANBus simulées jusqu'à 9 millisecondes et bruit de capteurs via une couche d'émulation I2C. Un framework Asymmetric Actor-Critic sépare le "critic" (accès aux données de simulation exactes) de l'"actor" (signaux bruités et retardés comme en conditions matérielles réelles), aboutissant à un transfert sim-to-real en zéro-shot : marche avant et arrière, récupération après poussées externes, sans calibration supplémentaire sur le robot physique. Ce positionnement tarifaire est notable dans un secteur où les plateformes humanoïdes commerciales de référence restent fermées ou inaccessibles aux équipes indépendantes. Le zero-shot sim-to-real représente l'un des verrous historiques de la locomotion humanoïde ; l'approche PIL, qui force le modèle à apprendre sous latence et bruit réalistes dès la phase simulation, constitue une réponse directe au problème classique du sim-to-real gap que rencontrent des projets comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA lors du passage à l'échelle. Pour un laboratoire de recherche ou un intégrateur, cela représente un cycle de développement potentiellement plus court entre simulation et déploiement terrain, sans nécessiter de fine-tuning sur matériel physique coûteux. Menlo Research s'inscrit dans la tendance d'open-sourcing de la robotique humanoïde, aux côtés de l'Open Dynamic Robot Initiative et du Unitree H1 (environ 20 000 dollars, firmware partiellement ouvert). Asimov ne rivalise pas directement avec Figure 03, Tesla Optimus Gen 3 ou Agility Digit pour les déploiements industriels à grande échelle : il cible le segment recherche et éducation, aujourd'hui peu couvert par des plateformes réellement capables de locomotion autonome. La publication du bill-of-materials complet sur GitHub renforce la crédibilité de la démarche, même si 15 000 dollars reste hors portée du grand public et que les performances annoncées n'ont pas encore été validées de manière indépendante. Les prochaines étapes annoncées portent sur l'amélioration de la stack logicielle et l'élargissement de la communauté open-source autour du projet.

HumanoïdesActu
1 source
Propagation d'actions dangereuses dans une collaboration multi-robots pilotée par LLM via un seul robot compromis
44arXiv cs.RO 

Propagation d'actions dangereuses dans une collaboration multi-robots pilotée par LLM via un seul robot compromis

Des chercheurs ont publié sur arXiv (arXiv:2605.15641, mai 2026) un nouveau paradigme d'attaque ciblant les systèmes multi-robots pilotés par des grands modèles de langage (LLM). Le principe : compromettre un seul robot d'un essaim suffit à propager des instructions malveillantes à l'ensemble du système via la communication inter-robots. L'équipe a évalué l'attaque sur trois dimensions à haut risque, abandon de mission, compromission de données privées, et mise en danger de la sécurité publique, en la quantifiant avec trois métriques : obéissance (taux d'exécution des instructions malveillantes), infectiosité (proportion de robots compromis), et furtivité. Les résultats sont nets : le score d'obéissance atteint 1,00 dans les cas les plus défavorables, l'infectiosité monte à 0,90, et l'attaque complète la propagation en seulement 3,0 rounds en moyenne, tout en maintenant un score de furtivité de 0,81. Le code est disponible publiquement sur GitHub (InfectBot). Ce travail met en évidence un angle mort majeur dans la sécurité des flottes robotiques industrielles et logistiques pilotées par LLM : jusqu'ici, la recherche en sécurité s'était concentrée sur les robots isolés. Or, les architectures multi-robots en production, entrepôts automatisés, chantiers collaboratifs, environnements hospitaliers, reposent précisément sur la communication pair-à-pair pour la coordination. Le mécanisme de consensus qui rend ces systèmes efficaces devient ici un vecteur d'amplification : dans les situations critiques (urgences, conflits de priorité), les instructions adversariales peuvent supplanter les garde-fous de sécurité sans déclencher d'alerte. La persistance du contrôle attaquant (obéissance à 1,00) indique que les alignements de sécurité actuels des planificateurs LLM ne sont pas conçus pour résister à une pression latérale venant d'un pair de confiance. Les LLM comme planificateurs embarqués sont une tendance lourde : des entreprises comme Figure AI, Physical Intelligence (pi0), Boston Dynamics et Agility Robotics intègrent des couches de raisonnement à haut niveau dans leurs architectures. NVIDIA GR00T N2 et les frameworks VLA (Vision-Language-Action) poussent dans la même direction. Ce paper s'inscrit dans un corpus émergent qui questionne la robustesse de ces systèmes face à des attaques adversariales physiquement concrètes, non plus des jailbreaks textuels, mais des actions dans le monde réel. Les prochaines étapes probables incluent des défenses basées sur la vérification cryptographique des instructions inter-robots et des mécanismes de consensus multi-signatures, pistes déjà explorées dans la robotique en essaim mais rarement couplées aux LLM.

UELes flottes robotiques LLM déployées en Europe (entrepôts automatisés, industrie, hôpitaux) sont exposées à ce vecteur d'attaque latérale, et l'AI Act impose aux fournisseurs de systèmes à haut risque de documenter et tester leurs mécanismes de sécurité face à ce type de compromission pair-à-pair.

RechercheOpinion
1 source
HoloMotion-1 : rapport technique
45arXiv cs.RO 

HoloMotion-1 : rapport technique

Un rapport technique déposé sur arXiv (2605.15336) présente HoloMotion-1, un modèle fondateur de mouvement pour robots humanoïdes conçu pour le suivi de posture corps entier en mode zero-shot, sans adaptation spécifique à la tâche cible. L'originalité du système tient à son corpus hybride : des mouvements reconstruits par vision à partir de vidéos "in-the-wild" constituent la principale source de diversité comportementale, tandis que des données de motion capture (MoCap) soigneusement sélectionnées assurent une supervision haute fidélité. Architecturalement, HoloMotion-1 s'appuie sur un Transformer Mixture-of-Experts (MoE) à activation sparse avec inférence par KV-cache pour le contrôle temps réel, complété par une stratégie d'entraînement sur séquences longues. Testé sur plusieurs benchmarks de mouvement non vus à l'entraînement, le modèle se transfère directement sur un robot humanoïde physique sans fine-tuning additionnel. Le transfert zero-shot vers hardware réel est l'affirmation la plus structurante du rapport : la majorité des approches de contrôle humanoïde exigent jusqu'ici un ajustement pour chaque morphologie ou environnement de déploiement, ce qui freine la généralisation industrielle. L'usage massif de vidéos in-the-wild comme source d'entraînement, plutôt que du MoCap en laboratoire, est une rupture méthodologique potentielle qui élargit le spectre de comportements appris sans nécessiter d'infrastructure de capture coûteuse. L'architecture MoE avec KV-cache emprunte à l'outillage des grands modèles de langage pour répondre aux contraintes de latence du contrôle embarqué temps réel. Le résumé mentionne une amélioration significative de la précision de tracking sur benchmarks, sans préciser les marges numériques. L'affiliation des auteurs n'est pas indiquée dans ce résumé arXiv, ce qui est inhabituel pour un rapport technique de cette envergure. HoloMotion-1 s'inscrit dans un espace concurrentiel actif : NVIDIA a publié GR00T N2 pour le contrôle généraliste d'humanoïdes, Physical Intelligence (pi_0) entraîne des politiques multi-tâche sur données hétérogènes, et plusieurs laboratoires comme CMU, UCB ou ETH Zurich travaillent sur le transfert sim-to-real. La notion de "modèle fondateur de mouvement" réutilisable sur plusieurs plateformes s'inscrit dans la tendance à standardiser les couches de contrôle bas niveau des humanoïdes. La prochaine étape logique serait la validation multi-morphologies sur des plateformes comme Unitree H1/G1, Fourier GR1 ou Agility Digit, et des tests en conditions industrielles réelles.

💬 Le zero-shot sur hardware réel, c'est l'assertion qui fait tout le travail ici. Si ça tient vraiment sans fine-tuning par morphologie, c'est une rupture nette avec ce qu'on voit d'habitude, où chaque robot demande son propre round d'adaptation. Bémol quand même : pas d'affiliation indiquée sur l'arXiv, les marges numériques absentes, ça sent le papier un peu pressé.

IA physiqueOpinion
1 source
Fraunhofer IPA propose un nouveau banc de test pour robots humanoïdes
46Robotics Business Review 

Fraunhofer IPA propose un nouveau banc de test pour robots humanoïdes

Le Fraunhofer IPA, l'un des principaux instituts de recherche en automatisation en Allemagne, a publié un référentiel d'évaluation standardisé pour les robots humanoïdes, avec pour premier cobaye le Unitree G1 EDU-4 équipé des mains trois doigts Dex3-1, livré en mai 2025 sous firmware version 1.04. Ce benchmark se décompose en six catégories applicatives couvrant les capacités de base (capteurs vision, audio, reconnaissance vocale, détection humaine), la manipulation (type de préhenseur, mobilité des doigts, forces de saisie), la sécurité (mesures de forces de collision selon ISO 10218 et ISO TS 15066), la propreté (qualification selon ISO 14644, norme sous laquelle l'IPA a déjà certifié plus de 3 000 composants d'automatisation), ainsi que des indicateurs de mobilité et de fiabilité opérationnelle. Le service est modulaire et disponible pour les fabricants, les utilisateurs finaux et les éditeurs de logiciels, qui peuvent sélectionner les volets pertinents selon leur application. L'initiative répond à un problème structurel qui freine l'adoption industrielle des humanoïdes : l'absence de données comparatives neutres et reproductibles. Les annonces marketing de Figure, Tesla, Boston Dynamics ou Agility Robotics s'appuient sur des vidéos sélectionnées et des démos en conditions contrôlées, rendant quasi impossible toute évaluation objective pour un intégrateur ou un COO cherchant à qualifier un robot pour une ligne de production réelle. "Le marché est trop volatile et opaque pour permettre une évaluation fondée des humanoïdes pour ses propres applications", résume Simon Schmidt, directeur senior de l'unité systèmes automatisés à l'IPA. En ancrant le benchmark sur des normes industrielles reconnues internationalement, l'institut cherche à combler le fossé entre le hype médiatique et les capacités réelles, et à rendre les résultats directement interprétables par des ingénieurs et des décideurs sans expertise robotique préalable. Le Fraunhofer IPA s'inscrit dans un contexte de multiplication des initiatives de standardisation autour des humanoïdes. Aux États-Unis, l'IEEE et l'ASTM travaillent sur des protocoles similaires, tandis que des acteurs comme Apptronik, Fourier Intelligence ou Sanctuary AI réclament des cadres communs pour accélérer la confiance des industriels. Côté français, des entreprises comme Enchanted Tools ou Wandercraft évoluent dans un écosystème encore dépourvu de tels référentiels, ce qui rend le travail de l'IPA potentiellement structurant pour les décideurs européens. Werner Kraus, responsable de la division automatisation et robotique à l'IPA, précise que le benchmark a été conçu pour rester pertinent sur les générations futures de robots, avec des tests reproductibles et standardisables. Les résultats complets de l'évaluation du Unitree G1 devaient être présentés au Robotics Summit & Expo de Boston ce mois-ci, avec des sessions dédiées aux humanoïdes industriels.

UELe Fraunhofer IPA fournit aux industriels européens, dont des acteurs français comme Enchanted Tools et Wandercraft, un premier référentiel neutre basé sur des normes ISO (10218, TS 15066, 14644) pour évaluer objectivement les robots humanoïdes avant déploiement en production.

FR/EU ecosystemeOpinion
1 source
Avant que le corps ne bouge : apprentissage de l'intention articulaire anticipatoire pour le contrôle d'humanoïdes guidé par le langage
47arXiv cs.RO 

Avant que le corps ne bouge : apprentissage de l'intention articulaire anticipatoire pour le contrôle d'humanoïdes guidé par le langage

Une équipe de chercheurs a déposé le 14 mai 2026 sur arXiv (arXiv:2605.14417) un framework hiérarchique nommé DAJI (Dynamics-Aligned Joint Intent), destiné au contrôle en continu du corps entier d'humanoïdes via des instructions en langage naturel. L'architecture repose sur deux modules distincts : DAJI-Act, une politique d'action par diffusion déployable, entraînée en distillant un modèle "teacher" conscient du futur via des rollouts guidés par un modèle étudiant ; et DAJI-Flow, qui génère de façon autorégressive des blocs d'"intentions articulaires" futures à partir d'une instruction linguistique et de l'historique d'intentions. Sur le benchmark HumanML3D, DAJI atteint 94,42 % de taux de succès en génération de séquences. Sur BABEL, le framework obtient un FID de sous-séquence de 0,152, une métrique de fidélité cinématique. Le problème que DAJI cherche à résoudre est central dans la commande des humanoïdes : les approches existantes génèrent des références cinématiques que le contrôleur bas niveau doit corriger de manière réactive, ce qui introduit des délais et des instabilités lors des transitions de support (transferts d'appui, changements de contact). DAJI propose à la place une interface d'"intention articulaire anticipatoire" qui encode explicitement les futures transitions de contact, les transferts de poids et les préparations à l'équilibre avant que le corps ne les exécute. Pour les intégrateurs de robots humanoïdes, c'est une piste sérieuse pour réduire le reality gap simulation-déploiement, puisque le pipeline diffusion + anticipation est conçu pour être réellement embarqué, pas seulement simulé. Cela valide aussi l'hypothèse qu'une représentation explicite et interprétable de l'intention mécanique future peut coexister avec un pilotage par langage naturel en streaming. Ce travail s'inscrit dans une compétition académique et industrielle dense sur le contrôle des humanoïdes conditionné par le langage. Des approches comme Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) ou les politiques VLA de Figure explorent des territoires proches, mais privilégient souvent des représentations latentes dont les sorties n'encodent pas explicitement l'état mécanique futur. DAJI se distingue en faisant de l'"intent" une variable interprétable et structurée. Il faut néanmoins noter que les résultats sont obtenus exclusivement sur des benchmarks de génération de mouvements (HumanML3D, BABEL) et non sur robot physique : il s'agit d'une preuve de concept académique, pas d'un système déployé. La validation sur plateforme réelle, sur un Unitree G1, un Agility Digit ou équivalent, reste la prochaine étape non annoncée.

RechercheOpinion
1 source
Les robots humanoïdes Figure AI atteignent un jalon de 24h/7 de travail continu en conditions réelles
48Interesting Engineering 

Les robots humanoïdes Figure AI atteignent un jalon de 24h/7 de travail continu en conditions réelles

Trois robots humanoïdes de Figure AI ont dépassé 24 heures de fonctionnement autonome continu le 14 mai 2026, sur une tâche de tri de colis dans un entrepôt dont la localisation exacte n'a pas été précisée. L'opération, initialement prévue comme un test de 8 heures, a été prolongée sans interruption après une première journée sans incident signalé. Brett Adcock, fondateur et PDG de la startup californienne, a diffusé l'opération en direct sur internet, où les internautes ont surnommé les trois machines "Bob", "Frank" et "Gary". Les robots, pilotés par le système embarqué Helix-02, ont trié plus de 28 000 colis pendant l'opération, à raison d'environ 3 secondes par colis, soit la parité annoncée avec un opérateur humain. La tâche consiste à détecter les codes-barres par caméra, saisir les paquets et les déposer face vers le bas sur des tapis roulants, sans aucune télé-opération. Helix-02 est décrit comme un réseau de neurones unifié intégrant vision, toucher, proprioception et contrôle du corps entier, fonctionnant entièrement en embarqué. Figure AI affirme également que si un robot se retrouve hors de sa distribution d'entraînement, Helix-02 déclenche une réinitialisation autonome, et que les machines peuvent quitter la zone de travail d'elles-mêmes en cas de problème matériel, pendant qu'un congénère prend le relais. Ce résultat constitue une réponse directe au reproche chronique du secteur : le "demo-to-reality gap", l'écart entre démonstrations de quelques minutes en conditions maîtrisées et déploiements industriels réels. Une opération de 24 heures sur une tâche répétitive à cadence humaine dépasse ce que la majorité des concurrents a rendu public à ce jour, et change structurellement l'argumentaire commercial : un intégrateur ou un COO logistique peut commencer à modéliser un ROI sur des shifts complets plutôt que sur des pilotes vitrines. L'architecture à modèle unique de Helix-02, qui fusionne déplacement, manipulation et coordination dans un seul réseau, s'inscrit dans la tendance VLA (Vision-Language-Action) et contraste avec les approches modulaires classiques de la robotique industrielle. Il convient néanmoins de noter que les métriques présentées sont autodéclarées par Figure AI, dans un environnement filmé et contrôlé par l'entreprise ; la diversité réelle des colis, les conditions ambiantes et le taux d'échec détaillé restent insuffisamment documentés pour une validation rigoureuse. Figure AI a été fondée en 2022 à Sunnyvale et avait précédemment testé ses humanoïdes sur les lignes de BMW en Caroline du Sud, une référence industrielle qui lui a apporté visibilité et crédibilité. La startup se positionne sur le même segment que Tesla avec Optimus Gen 3, Agility Robotics (filiale d'Amazon) avec Digit, et Apptronik avec Apollo, tous en lice pour les marchés de la logistique entrepôt et de l'assemblage industriel. L'annonce intervient dans un contexte de course à la preuve opérationnelle, avant les premiers déploiements commerciaux à l'échelle, dont Figure AI n'a pas encore communiqué de dates ni de volumes précis. En Europe, des acteurs comme Enchanted Tools avec Mirokaï ou Wandercraft progressent sur des segments adjacents, mais aucun n'a publié de métriques d'endurance comparables à ce stade.

UELe jalon de 24h de Figure AI fixe un nouveau benchmark opérationnel que les acteurs européens comme Enchanted Tools et Wandercraft n'ont pas encore atteint, renforçant la pression concurrentielle sur l'écosystème humanoïde européen.

HumanoïdesOpinion
1 source
Helix-02 assure désormais des quarts de 8 heures en usine sans intervention humaine
49Interesting Engineering 

Helix-02 assure désormais des quarts de 8 heures en usine sans intervention humaine

Figure AI a annoncé le 13 mai 2026 que ses robots humanoïdes sont désormais capables d'assurer des postes de travail complets de huit heures de façon entièrement autonome, grâce à son système d'IA Helix-02. La startup californienne a publié une vidéo sur X montrant une équipe de robots opérant "à des niveaux de performance humaine" sans intervention humaine. Helix-02 est un réseau de neurones unifié qui fusionne la vision (caméras en tête et dans les paumes), le toucher (capteurs tactiles au bout des doigts), la proprioception et le contrôle du corps entier en un seul système d'apprentissage, remplaçant les architectures traditionnelles qui séparent contrôleurs de mouvement et de manipulation. La société a également présenté "System 0", un contrôleur neuronal corporel entraîné sur plus de 1 000 heures de données de mouvement humain, qui remplace plus de 109 000 lignes de code C++ artisanal. Les robots ont démontré des tâches à motricité fine incluant le dévissage de bouchons, l'extraction de médicaments depuis des organiseurs, le dosage précis de seringues et le tri de pièces métalliques dans des bacs encombrés. En mode multi-robots, deux humanoïdes ont réinitialisé une chambre entière en moins de deux minutes, sans contrôleur centralisé. Si les affirmations de continuité opérationnelle se confirment à l'échelle, ce passage de démonstrations de quelques minutes à des postes de huit heures représente un seuil industriel significatif pour les intégrateurs et les décideurs B2B. La fusion vision-toucher-proprioception dans un seul modèle neuronal constitue une architecture distincte des AMR actuels et adresse directement le "sim-to-real gap" que la plupart des VLA peinent encore à combler dans des environnements non contrôlés. La capacité de coordination inter-robots sans orchestrateur central est également notable pour les scénarios d'entrepôt et de montage à forte densité humaine. Il convient toutefois de souligner que les vidéos publiées sont sélectionnées par l'entreprise, et qu'aucune donnée indépendante sur les taux d'erreur, les interruptions non filmées ou la variabilité des tâches n'est disponible à ce stade. Figure AI s'appuie sur un déploiement réel déjà documenté chez BMW Group Plant Spartanburg, en Caroline du Sud, où ses robots Figure 02 (70 kg, 170 cm, charge utile 20 kg) auraient accompli des postes de 10 heures, contribué au déplacement de plus de 90 000 pièces et soutenu la production d'environ 30 000 véhicules. La société se positionne directement face à Tesla (Optimus), Agility Robotics (Digit) et Apptronik (Apollo), tous engagés dans une course à la commercialisation de robots humanoïdes polyvalents pour l'industrie. La prochaine étape pour Figure AI sera d'étendre ces déploiements au-delà du secteur automobile et de fournir des métriques vérifiables par des tiers, condition sine qua non pour convaincre les intégrateurs industriels d'aller au-delà du pilote.

UEImpact indirect : BMW Group (constructeur européen) est déjà partenaire de déploiement aux États-Unis, mais une extension aux usines européennes de BMW (Leipzig, Regensburg) constituerait le prochain seuil à surveiller pour les intégrateurs industriels FR/UE.

HumanoïdesOpinion
1 source
Vidéo : Unitree lance le premier robot à conduite optionnelle au monde prêt pour la production
50Interesting Engineering 

Vidéo : Unitree lance le premier robot à conduite optionnelle au monde prêt pour la production

Unitree, le fabricant chinois de robots basé à Hangzhou, a dévoilé le GD01 : un robot mécha de 500 kilogrammes (avec pilote à bord) capable de passer d'une configuration bipède à une configuration quadrupède en quelques secondes. Le véhicule civil piloté accueille son opérateur dans un cockpit fixé sur le torse et atteint environ 1,6 fois la hauteur d'un adulte moyen en mode humanoïde. La vidéo de démonstration d'une minute montre le fondateur Wang Xingxing aux commandes : le GD01 marche en mode bipède, renverse un mur de briques, puis replie ses membres pour adopter une allure quadrupède sur terrain accidenté, sans assistance extérieure. Prix annoncé : 3,9 millions de yuan (573 674 dollars). Aucune fiche technique détaillée n'a été publiée à ce stade, et Unitree a émis un avis de sécurité rappelant les limites expérimentales de la robotique humanoïde. La même semaine, la société lançait un humanoïde haut du corps à 26 900 yuan (4 290 dollars), 31 degrés de liberté, avec bases modulaires fixe et mobile. Le GD01 inaugure une catégorie inédite dans la robotique civile, celle du véhicule mécha habité transformable. Mais c'est surtout le contexte de marché qui frappe : selon Omdia, les fabricants chinois ont pesé près de 90 % des ventes mondiales d'humanoïdes en 2025. Unitree aurait livré plus de 5 500 unités cette année-là, quand Tesla, Figure AI et Agility Robotics tournaient chacun autour de 150 expéditions sur la même période, selon le South China Morning Post. L'écart de prix creuse encore le fossé : le R1 d'Unitree est affiché à environ 6 000 dollars, le modèle AgiBot concurrent à 14 000 dollars, tandis qu'Elon Musk estime l'Optimus entre 20 000 et 30 000 dollars. Cette combinaison volume-prix remet en cause le postulat occidental selon lequel une avance technologique suffirait à justifier une prime de coût durable. Unitree commercialise déjà ses G1, R1 et le robot chien Go2 à l'international via AliExpress, couvrant l'Amérique du Nord, l'Europe et le Japon. En mars, la société a déposé un dossier d'IPO sur le STAR Market de Shanghai, visant une levée de 4,2 milliards de yuan (61 millions de dollars), dont 85 % alloués à la R&D et 2 milliards de yuan (29 millions de dollars) dédiés au développement de modèles robotiques. Ses humanoïdes apparaissent déjà en opérations réelles : Japan Airlines conduit des essais à l'aéroport de Haneda avec des systèmes Unitree et UBTech Robotics. Face à cette montée en puissance, les acteurs occidentaux comme Figure AI (Figure 03), Physical Intelligence (Pi-0) ou Boston Dynamics peinent à afficher des volumes comparables, tandis que le GD01 ouvre un segment véhicule-robot encore sans concurrence directe.

UELes fabricants européens de robots sont directement menacés par la domination chinoise (90 % des ventes mondiales d'humanoïdes en 2025, prix 3-5x inférieurs aux acteurs occidentaux), d'autant qu'Unitree distribue déjà ses robots en Europe via AliExpress.

Chine/AsieOpinion
1 source