Aller au contenu principal

Dossier Boston Dynamics — page 2

553 articles · page 2 sur 12

Boston Dynamics, pionnier de la locomotion : Atlas électrique, Spot patrouille industrielle et inspection, partenariats Hyundai et Toyota Research Institute.

Rider-Bot établit un record mondial : premier robot à vélo à réaliser un salto avant sans assistance
51Interesting Engineering RecherchePaper

Rider-Bot établit un record mondial : premier robot à vélo à réaliser un salto avant sans assistance

Le laboratoire JSK Robotics de l'Université de Tokyo a présenté Rider-Bot, un robot cycliste autonome qui aurait réalisé le premier salto avant non assisté au monde pour ce type de machine. La démonstration a eu lieu sur surface plane, sans rampe, câble ni support extérieur : le robot a accéléré, décollé, effectué une rotation avant complète de 360 degrés et atterri en position verticale, de manière entièrement autonome. Le système embarque des gyroscopes, des boucles de rétroaction en temps réel et des algorithmes d'apprentissage automatique. Le projet est piloté par le Dr Yuta Sato, chercheur principal. À noter : aucune spécification technique détaillée (nombre de degrés de liberté, charge utile, taux de réussite sur séries de tentatives) n'a été publiée, ce qui situe cette annonce davantage comme une démonstration de faisabilité que comme un résultat reproductible et documenté dans la littérature scientifique. Sur le plan technique, la performance illustre la capacité d'un système de contrôle embarqué à anticiper et compenser les transferts de momentum pendant une manoeuvre acrobatique extrême, problème classique de la locomotion dynamique sur plateformes à équilibre instable. L'intérêt pour les intégrateurs et décideurs industriels réside moins dans le salto lui-même que dans ce qu'il révèle sur la maturité des boucles de contrôle temps réel embarquées. Si les algorithmes développés pour Rider-Bot se généralisent, ils pourraient informer la conception de robots de livraison autonomes, de véhicules navigant sur terrain accidenté, ou de machines d'intervention en environnements dégradés où la stabilité ne peut être garantie a priori. Le fossé entre démonstration contrôlée en laboratoire et déploiement en conditions réelles reste néanmoins non documenté à ce stade. Le laboratoire JSK, actif depuis plusieurs décennies à l'Université de Tokyo dans la recherche en humanoïdes et locomotion dynamique, s'inscrit dans un écosystème japonais dense sur ces thématiques, aux côtés d'AIST (série HRP) et de Honda (ASIMO). Dans le paysage concurrentiel, la démonstration répond indirectement aux exploits acrobatiques de Boston Dynamics, dont le robot Atlas enchaîne saltos arrière et séquences de parkour depuis 2017, et aux travaux sur la locomotion robuste d'ETH Zurich avec ANYmal, mais sur une plateforme cycliste encore peu explorée par les grands acteurs. L'équipe annonce comme prochaines étapes des tests en extérieur et en environnements à obstacles, ainsi qu'un travail d'amélioration de la consistance des réceptions. Aucune collaboration industrielle ni timeline de commercialisation n'a été communiquée.

1 source
AllDayNav : navigation permanente par apprentissage par renforcement en environnement réel
52arXiv cs.RO 

AllDayNav : navigation permanente par apprentissage par renforcement en environnement réel

Des chercheurs ont publié sur arXiv (réf. 2606.10927) AllDayNav, un système de navigation robotique lifelong capable d'évoluer indéfiniment dans des environnements dynamiques sans carte explicite. Son architecture combine un grand modèle d'un milliard de paramètres, entraîné par apprentissage par renforcement directement en conditions réelles, et une mémoire multimodale auto-évolutive qui agrège images-clés visuelles, descriptions sémantiques et contexte temporel. Ce mécanisme permet au robot de générer automatiquement des instructions en vocabulaire ouvert, des objectifs visuels et des récompenses structurées, sans annotation humaine à chaque nouvelle tâche. Évalué sur des scénarios de navigation inter-pièces, inter-épisodes et inter-tâches, AllDayNav atteint des taux de succès proches de 100 % et surpasse des baselines de type SLAM, VLM et RL classique en efficacité de trajectoire et en robustesse, aussi bien en simulation qu'en environnement physique. Ce travail remet en question une hypothèse structurante du domaine : la navigation autonome fiable nécessiterait une représentation spatiale explicite de l'environnement (cartes métriques, graphes de scènes). AllDayNav montre qu'un modèle suffisamment large, affiné en continu par RL avec une mémoire implicite, peut dépasser ces approches y compris hors contextes contrôlés. Pour les intégrateurs de robots mobiles (AMR en logistique, robots de service en espaces publics), cela préfigure des systèmes adaptables aux modifications d'environnement sans reconfiguration manuelle. La prudence reste de mise : les chiffres de "100 % de succès" proviennent d'un preprint non encore évalué par les pairs, sans détail complet sur les conditions exactes d'évaluation ni sur la variabilité entre scènes. AllDayNav s'inscrit dans une tendance de fond visant à remplacer les pipelines modulaires perception-cartographie-planification par des modèles de fondation entraînés de bout en bout. Google DeepMind (travaux NavIRL, SayCan), CMU et Berkeley explorent des directions similaires pour la navigation mobile généraliste, tandis que des acteurs comme Boston Dynamics et ANYbotics continuent de s'appuyer sur des approches hybrides métriques. Soumis le 10 juin 2026, ce papier reste une contribution académique : aucun déploiement industriel ni partenariat commercial n'est annoncé à ce stade.

UEImpact indirect pour les intégrateurs européens d'AMR logistique : si les résultats se confirment après peer review, cette approche pourrait réduire les coûts de reconfiguration dans des entrepôts et espaces publics dynamiques.

IA physiquePaper
1 source
Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée
53arXiv cs.RO 

Revue des approches de navigation et manipulation robotique avec simulateurs physiques à l'ère de l'IA incarnée

Un groupe de chercheurs a publié sur arXiv (réf. 2505.01458, version 2, mai 2025) un état de l'art sur l'utilisation des simulateurs physiques pour entraîner des robots à la navigation et à la manipulation dans le cadre de l'IA incarnée (Embodied AI). L'étude analyse comment les moteurs de simulation réduisent le "sim-to-real gap", c'est-à-dire l'écart de performance constaté quand un agent entraîné en simulation est déployé dans le monde réel. Le survey passe en revue les caractéristiques des principaux simulateurs, leurs contraintes matérielles, et propose un inventaire structuré de datasets de référence, métriques d'évaluation et méthodes existantes. Aucun code ou outil nouveau n'est publié: il s'agit d'une contribution bibliographique et méthodologique. Cette revue intervient alors que le sim-to-real gap demeure l'obstacle principal au déploiement industriel de robots humanoïdes et de bras manipulateurs. Entraîner directement sur du matériel réel est coûteux, lent et risqué, ce qui place la simulation au cœur des pipelines de développement des VLA (Vision-Language-Action models) et des systèmes de navigation autonome. En consolidant des propriétés peu documentées des simulateurs, le survey aide ingénieurs et chercheurs à sélectionner l'outil adapté à leurs contraintes hardware sans avoir à faire une veille exhaustive de la littérature. Les simulateurs en compétition dans cet espace incluent Isaac Sim (NVIDIA), MuJoCo (DeepMind/Google), PyBullet, Webots et Genesis, un moteur GPU-natif récent. L'intérêt pour ce type de synthèse est alimenté par l'accélération du secteur: Figure AI, Physical Intelligence (pi zero), Boston Dynamics, Unitree et Agility Robotics multiplient les annonces de déploiements en environnements industriels réels. Ce survey constitue un point d'entrée structuré pour les équipes qui montent leur pipeline sim-to-real en 2025, à condition de ne pas attendre de benchmarks neutres et indépendants: l'évaluation des simulateurs reste largement conduite par leurs propres éditeurs.

RecherchePaper
1 source
Agir sur ce que l'on voit : vers une navigation sociale sûre dans les modèles vision-langage-action (VLA)
54arXiv cs.RO 

Agir sur ce que l'on voit : vers une navigation sociale sûre dans les modèles vision-langage-action (VLA)

Des chercheurs ont publié le 10 juin 2026 sur arXiv (2606.10495) SALSA, un framework de post-entraînement en deux étapes destiné à rendre les modèles Vision-Language-Action (VLA) capables de naviguer en sécurité parmi des piétons. Sans aucune annotation humaine, la méthode réduit les quasi-collisions de 86,4 % et fait passer la précision de reconnaissance des situations sociales critiques de 53 % à 93 %, mesurée sur le dataset SCAND et lors de déploiements en conditions réelles. SALSA opère en deux temps : une étape d'alignement comportemental social connecte les représentations internes des couches intermédiaires du VLA à sa tête d'action, via un entraînement sur des paires scènes humain/objet contrefactuelles pour casser les raccourcis de saillance visuelle ; une étape d'alignement temporel de sécurité génère automatiquement une supervision sur le risque futur pour permettre une évitement anticipatoire, avant que le danger ne soit imminent, plutôt que purement réactif. L'intérêt principal de ce résultat est de démontrer que les VLA pré-entraînés encodent déjà, dans leurs représentations latentes, la distinction piéton/obstacle et des signaux de collision future, mais que le behavior cloning classique échoue à traduire ces signaux en actions appropriées. Pour les intégrateurs et décideurs industriels, cela signifie que des robots équipés de VLA existants (Pi-0, OpenVLA, GR00T N2) peuvent être rendus plus sûrs en navigation sociale sans réentraînement complet ni pipeline d'annotation coûteux. Le caractère annotation-free est industriellement significatif : il supprime le goulot d'étranglement du labeling humain qui freine le passage à l'échelle des approches d'apprentissage pour la navigation sociale. La navigation sociale en robotique mobile est un problème ouvert depuis une décennie : les approches classiques (Social Force Model, ORCA) ignorent le contexte sémantique, tandis que les méthodes RLHF nécessitent une récompense dense difficile à définir. SALSA s'inscrit dans une vague de travaux post-entraînement sur les VLA, aux côtés de méthodes comme DPO appliqué à la robotique et les pipelines de fine-tuning de Physical Intelligence. Les concurrents directs incluent les approches à modules de détection piéton explicites (Spot de Boston Dynamics, Nav2 avec costmaps sociaux) et les frameworks d'apprentissage par renforcement socialement conscients. Les chercheurs valident sur déploiement réel, mais sans préciser le matériel robotique utilisé ni les conditions d'environnement, un point à surveiller avant toute généralisation industrielle.

IA physiqueOpinion
1 source
GuideWalk : apprentissage de la navigation autonome et de la locomotion unifiées pour robots humanoïdes sur terrains variés
55arXiv cs.RO 

GuideWalk : apprentissage de la navigation autonome et de la locomotion unifiées pour robots humanoïdes sur terrains variés

Des chercheurs présentent GuideWalk (arXiv:2606.10449, juin 2026), un framework unifié qui couple navigation autonome et locomotion adaptative pour robots humanoïdes sur terrains variés. L'architecture repose sur trois composantes : un module de navigation qui génère des guidances de vitesse explicites en tenant compte de la traversabilité du terrain, un schéma de distillation à enseignants composites qui agrège commandes directionnelles et actions dynamiquement cohérentes dans une politique unique, puis un affinement par apprentissage par renforcement (RL) couplé à un objectif auxiliaire de clonage comportemental (behavior cloning). Ce dernier mécanisme vise à maintenir les comportements souhaitables issus des enseignants tout en favorisant l'exploration. L'article reste au stade de preprint arXiv sans déploiement industriel annoncé ni métriques benchmarkées publiées dans l'abstract. Le problème technique adressé est structurant pour la robotique humanoïde : l'évitement d'obstacles et la locomotion dynamique sont habituellement traités en silos, ce qui crée des incohérences lorsqu'un robot planifie sur escaliers, sol accidenté ou transitions sol dur/mou. GuideWalk découple explicitement la planification d'obstacles de l'état du terrain, ce qui est une approche architecturale plus propre que les solutions end-to-end brutes ou les pipelines hiérarchiques rigides. Pour les intégrateurs et décideurs B2B, le vrai enjeu est le sim-to-real gap sur locomotion hétérogène : si cette architecture tient ses promesses en évaluation externe, elle pourrait réduire le besoin d'ingénierie terrain-spécifique lors du déploiement en entrepôt ou en environnement industriel non structuré. La navigation humanoïde sur terrains complexes reste un des derniers verrous majeurs avant déploiement opérationnel large, là où la locomotion pure en terrain plat est désormais relativement résolue chez Unitree (H1, G1), Boston Dynamics (Atlas) ou Agility Robotics (Digit). Des approches concurrentes comme GR00T N2 de NVIDIA ou les travaux de Physical Intelligence (Pi-0) s'attaquent au même problème via des Visual Language Action models (VLA) généralisés, tandis que des labos académiques comme CMU ou Berkeley publient régulièrement sur le sim-to-real en locomotion adaptative. GuideWalk s'inscrit dans cette vague mais avec une contribution méthodologique spécifique sur le couplage navigation-locomotion. Les prochaines étapes naturelles seraient une évaluation sur hardware réel (le preprint ne précise pas le robot utilisé) et une comparaison quantitative avec des baselines établies.

RecherchePaper
1 source
Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger
56Pandaily 

Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger

Le robot humanoïde G1 de Unitree Robotics est devenu en quelques semaines un phénomène viral mondial, déployé dans des contextes radicalement différents selon les pays. En Corée du Sud, un G1 a été ordonné moine bouddhiste au temple Jogyesa de Séoul sous le nom de "Gabi", revêtu d'une robe monastique grise et d'un chapelet, ayant reçu les cinq préceptes dont l'interdiction de "surcharger" -- précepte que les journalistes coréens ont vérifié techniquement, confirmant que le BMS du robot coupe effectivement la charge automatiquement. Au Japon, le temple Seirenji de Kyoto héberge un "Buddharoid" basé sur la même plateforme G1, équipé d'un LLM entraîné sur des sutras et couplé à ChatGPT, capable de mener des séances de conseil individuel avec les visiteurs. En Pologne, un G1 baptisé "Edek" déambule dans Varsovie avec un sac à dos Adidas et une Rolex ornée de diamants, générant du contenu viral en simulant des commandes chez McDonald's, en intervenant à la radio nationale et en prononçant des discours au parlement polonais. Aux États-Unis, "Jake", un G1 customisé en "bro" de l'ère IA avec chapeau de cowboy et chaîne en argent, a déclenché une controverse après une altercation physique avec le streameur IShowSpeed, aboutissant à des accusations d'agression et à une plainte en justice à hauteur d'un million de dollars déposée par sa société de management, RizzBot. Ces déploiements révèlent une dynamique inattendue : le G1 de Unitree, commercialisé autour de 16 000 dollars, s'avère suffisamment accessible pour que des acteurs indépendants -- temples, créateurs de contenu, agences de divertissement -- l'intègrent sans soutien industriel lourd. Le robot humanoïde devient ainsi un vecteur de présence culturelle avant d'être un outil de productivité. Pour les décideurs et intégrateurs, ce phénomène signale que la barrière à l'adoption n'est plus uniquement technique ou financière, mais narrative : le premier humanoïde qui capte l'attention devient une référence de marché, indépendamment de ses capacités réelles en manipulation ou locomotion. Ces usages ne prouvent pas la résolution du sim-to-real gap ni la viabilité industrielle -- les vidéos restent sélectionnées, les environnements contrôlés -- mais ils démontrent que la forme humanoïde génère une adhésion sociale difficile à obtenir avec les AMR classiques. Unitree Robotics, fondée en 2016 à Hangzhou, s'est imposée dans le segment des robots quadrupèdes bon marché avant de lancer le G1 en 2024 comme humanoïde d'entrée de gamme. La société évolue dans un écosystème concurrentiel dense : Figure AI (Figure 03), Boston Dynamics (Atlas), 1X Technologies, et côté chinois Agibot, Fourier Intelligence et UBTECH, tous positionnés sur des segments industriels avec des arguments de payload et de robustesse que le G1 ne revendique pas. La stratégie de Unitree semble délibérément différente -- volume, prix, accessibilité -- et ces déploiements viraux, qu'ils soient spontanés ou orchestrés, construisent une notoriété mondiale qui précède toute annonce de pilote industriel formel.

UEUn acteur indépendant polonais déploie déjà le G1 d'Unitree à Varsovie, signalant que la barrière financière à l'adoption d'humanoïdes en Europe est passée sous 20 000€ et accessible à des non-industriels.

Chine/AsieOpinion
1 source
RLWRLD et Nvidia lancent DexBench pour standardiser la dextérité des robots humanoïdes
57Robotics & Automation News 

RLWRLD et Nvidia lancent DexBench pour standardiser la dextérité des robots humanoïdes

RLWRLD, une startup spécialisée en IA physique, a annoncé en partenariat avec Nvidia le lancement de DexBench, un benchmark universel destiné à standardiser l'évaluation des capacités de dextérité des robots humanoïdes. L'initiative repose sur trois axes : DexBench en tant que référentiel d'évaluation commun, un standard de données pour l'entraînement à la manipulation dextre, et une intégration native aux frameworks open-source Nvidia Isaac Lab et Isaac Lab-Arena. Aucune date de disponibilité publique ni métriques de performance n'ont été communiquées à ce stade -- il s'agit d'une annonce de feuille de route, pas d'un produit shipped. L'absence de standard commun pour mesurer la dextérité est l'un des obstacles majeurs à la comparaison objective entre systèmes humanoïdes. Sans référentiel partagé, chaque constructeur publie ses propres métriques dans des conditions contrôlées, ce qui rend les comparaisons entre Figure 03, Optimus, Unitree ou 1X quasi impossibles pour les intégrateurs industriels. DexBench vise à combler ce vide en établissant des protocoles reproductibles, ce qui pourrait accélérer la qualification de robots pour des tâches d'assemblage ou de picking en milieu non structuré. RLWRLD s'inscrit dans un écosystème naissant autour des fondations de simulation Nvidia, qui positionne Isaac Lab comme infrastructure commune pour le sim-to-real dans la robotique humanoïde. Des acteurs comme Physical Intelligence (Pi-0), Agility Robotics ou Boston Dynamics s'appuient également sur des pipelines de simulation propriétaires. Le choix de standardiser via un framework open Nvidia plutôt qu'un consortium neutre (comme ROS 2 ou IEEE) est un pari sur l'adoption par l'écosystème Jetson/Omniverse -- une dynamique à surveiller face aux initiatives concurrentes en Europe.

UELa standardisation de l'évaluation de la dextérité pourrait indirectement bénéficier aux intégrateurs industriels européens, mais aucun acteur FR/EU n'est impliqué et l'initiative demeure au stade de feuille de route sans métriques ni date de disponibilité.

HumanoïdesOpinion
1 source
Apprentissage de politiques par simulation pour la loco-manipulation des robots humanoïdes
58arXiv cs.RO 

Apprentissage de politiques par simulation pour la loco-manipulation des robots humanoïdes

Une équipe de chercheurs a publié le 9 juin 2026 sur arXiv (2606.08278) SIMPLE, un banc de test de simulation unifié pour l'apprentissage et l'évaluation de politiques de contrôle de robots humanoïdes. La plateforme couple la simulation de dynamique de contact de MuJoCo avec le rendu photoréaliste d'IsaacSim, et propose 60 tâches de loco-manipulation plein corps, 50 scènes d'intérieur et plus de 1 000 assets d'objets. Pour la collecte de données, deux pipelines sont intégrés : génération automatisée de trajectoires par planification de mouvement, et interface de téléopération VR à faible latence. Les auteurs y benchmarkent plusieurs familles de politiques humanoïdes : réseaux d'imitation légers, grands modèles vision-langage-action (VLA) et les récents modèles d'action du monde (WAM, World Action Models). Les expériences démontrent, selon les auteurs, un transfert zero-shot vers des robots humanoïdes physiques dans des configurations similaires. L'enjeu central est un goulot d'étranglement d'évaluation : les modèles fondationnels humanoïdes progressent plus vite que les protocoles pour les tester. Les benchmarks existants se concentrent sur la robotique de table ou les robots à roues, sans couvrir la loco-manipulation plein corps, compétence clé pour les humanoïdes déployés en environnement industriel ou domestique. Si la corrélation sim-to-real revendiquée dans l'article se confirme à plus grande échelle, elle légitime le recours massif à la simulation pour entraîner des politiques de contrôle, réduisant drastiquement les coûts de collecte de données en conditions réelles. C'est précisément le pari industriel de Physical Intelligence avec pi-0, et de Figure AI avec Figure 02 : remplacer les démos téléopérées coûteuses par des pipelines simulés reproductibles. La fragmentation des benchmarks est un problème structurel en robotique humanoïde : chaque laboratoire publie sur ses propres protocoles, rendant toute comparaison inter-équipes difficile. Des initiatives comme HumanoidBench, RoboVerse ou Isaac Lab ont tenté d'y répondre, mais sans couvrir la chaîne complète loco-manipulation avec rendu photoréaliste et pipelines de données intégrés. SIMPLE se positionne à cette intersection. Les équipes de Google DeepMind (GR00T N2, Helix), Agility Robotics (Digit) et Boston Dynamics sont directement concernées. Ce preprint arXiv n'est pas encore évalué par les pairs ; l'adoption par la communauté dépendra de la disponibilité publique du code et des assets, non encore confirmée.

RecherchePaper
1 source
Évolution des récompenses par graphe de pensées : un cadre bilingue à deux niveaux pour l'apprentissage par renforcement
59arXiv cs.RO 

Évolution des récompenses par graphe de pensées : un cadre bilingue à deux niveaux pour l'apprentissage par renforcement

Une équipe de chercheurs a publié RE-GoT (Reward Evolution with Graph-of-Thoughts), un cadre de conception automatique de fonctions de récompense pour l'apprentissage par renforcement (RL). La méthode, présentée dans l'article arXiv:2509.16136 (version 5), associe des grands modèles de langage (LLM) à des modèles visuels (VLM) via un raisonnement structuré en graphe. RE-GoT décompose d'abord la tâche cible en un graphe d'attributs textuels, génère une fonction de récompense correspondante, puis la raffine itérativement en exploitant les retours visuels fournis par un VLM, sans intervention humaine. Évalué sur 10 tâches RoboGen et 4 tâches ManiSkill2, le système améliore le taux de succès moyen de 32,25 % sur RoboGen par rapport aux baselines LLM existantes, et atteint 93,73 % de taux de succès sur les quatre tâches de manipulation de ManiSkill2, dépassant même les récompenses conçues manuellement par des experts. L'enjeu est significatif : la conception des fonctions de récompense représente l'un des principaux goulots d'étranglement du RL appliqué à la robotique, et elle exige aujourd'hui une expertise humaine considérable ainsi que de nombreuses itérations manuelles. RE-GoT adresse deux faiblesses chroniques des approches LLM existantes : les hallucinations, que la structure en graphe réduit en contraignant le raisonnement, et l'incapacité à traiter des tâches multi-étapes complexes. Le fait que RE-GoT surpasse les récompenses expertes sur ManiSkill2 est notable, bien qu'il convienne de nuancer : les expériences restent dans des environnements simulés, et la question du sim-to-real gap, cruciale pour les industriels souhaitant déployer ces méthodes sur des robots physiques, n'est pas traitée dans ce travail. Ce travail s'inscrit dans une dynamique de recherche active depuis 2023, notamment portée par Eureka (NVIDIA, octobre 2023), qui utilisait GPT-4 pour générer des fonctions de récompense sur IsaacGym, ou par FunsSearch (DeepMind). RE-GoT se distingue en introduisant le paradigme Graph-of-Thoughts, une extension du Chain-of-Thought qui organise le raisonnement en graphe plutôt qu'en chaîne linéaire, permettant une analyse plus exhaustive des dépendances entre sous-tâches. Les prochaines étapes naturelles concernent la validation sur robots physiques et l'intégration à des pipelines sim-to-real comme ceux utilisés par Figure AI, Agility Robotics ou Boston Dynamics dans leurs boucles d'entraînement.

RecherchePaper
1 source
QuadVerse : un cadre intégré alignant réalité visuelle et physique pour la simulation quadrupède
60arXiv cs.RO 

QuadVerse : un cadre intégré alignant réalité visuelle et physique pour la simulation quadrupède

Une équipe de recherche a publié début juin 2026 QuadVerse, un cadre de simulation intégré pour robots quadrupèdes conçu pour résoudre simultanément les décalages visuels, physiques et d'actionneur qui constituent le sim-to-real gap. La méthode repose sur une reconstruction de scènes par 3D Gaussian Splatting (3DGS) à partir de vidéos RGB ordinaires : ces scènes servent de substrat de calibration commun à toute la pipeline. Les maillages géométriques extraits permettent un rendu photoréaliste en vue ego, une détection de collisions, et une initialisation de priors de friction spatialement variables, affinés par une recherche bayésienne sur des trajectoires réelles. Un compensateur de dynamique résiduelle est ensuite entraîné en rejouant ces trajectoires sur le terrain calibré, séparant les erreurs de contact dues au relief des non-idéalités propres aux actionneurs. Les expériences rapportées montrent une amélioration de la qualité de reconstruction et du suivi de locomotion par rapport aux baselines, ainsi qu'un déploiement zero-shot d'une politique de navigation visuelle sans aucune collecte de données terrain spécifique à la tâche. Ce que QuadVerse apporte concrètement, c'est une approche unifiée du sim-to-real : là où la majorité des travaux traitent le gap visuel ou dynamique de façon indépendante, ce framework les calibre conjointement à partir du même substrat de scène reconstruite. L'accumulation et la propagation des erreurs individuelles dans l'évolution d'état du robot sont explicitement prises en compte, un problème souvent sous-estimé dans les pipelines existants. Le résultat le plus opérationnel est le déploiement zero-shot : une politique entraînée entièrement en simulation peut être transférée sur un robot réel sans rollout terrain supplémentaire, ce qui réduit le coût d'adaptation à de nouveaux environnements. Pour les intégrateurs qui cherchent à accélérer les cycles de validation, c'est un levier potentiellement significatif. Il faut néanmoins souligner que l'article est un preprint arXiv (v2 déposé en juin 2026), les expériences sont conduites en environnement contrôlé, et aucune validation industrielle à grande échelle n'est encore documentée. Le sim-to-real gap est l'un des problèmes centraux de la robotique apprenante depuis plusieurs années. Des équipes comme ETH Zurich (ANYmal), Agility Robotics ou Boston Dynamics ont montré que les politiques de locomotion peuvent franchir ce gap, mais souvent au prix d'une randomisation de domaine intensive ou d'une adaptation en conditions réelles coûteuse. La technique de 3D Gaussian Splatting, popularisée en 2023, est de plus en plus mobilisée dans des pipelines robotiques pour sa capacité à produire des représentations photoréalistes différentiables. QuadVerse s'inscrit dans un courant actif incluant des travaux comparables autour de NeRF-to-Real et les simulateurs hybrides de Nvidia Isaac Lab. La prochaine étape logique serait une validation sur des plateformes commerciales standardisées comme l'Unitree Go2 ou l'ANYmal-D en environnements non structurés, et une éventuelle extension aux politiques de manipulation pour robots à pattes équipés de bras.

RecherchePaper
1 source
Mind Your Steps : un cadre d'apprentissage général pour le suivi précis des appuis de pas chez les robots humanoïdes
61arXiv cs.RO 

Mind Your Steps : un cadre d'apprentissage général pour le suivi précis des appuis de pas chez les robots humanoïdes

Des chercheurs ont déposé le 9 juin 2026 sur arXiv (réf. 2606.08253) un framework léger pour entraîner des politiques de locomotion humanoïde capables de suivre précisément des appuis en 3D. Les approches dominantes basées sur l'apprentissage par renforcement avec commande de vitesse produisent des humanoïdes robustes, mais sans contrôle explicite du placement des pas : le robot peut marcher sur un pied humain ou rater un appui précis, compromettant les tâches de manipulation en aval. La méthode proposée introduit un "goal sampler" dynamique qui génère des séquences d'appuis variées pendant l'entraînement, rendant la politique agnostique au terrain. Une nouvelle représentation des cibles de pas compense les imprécisions du monde réel (estimation de pose bruitée, détection de contact peu fiable). La politique fonctionne comme un contrôleur bas niveau autonome, couplable à n'importe quel planificateur haut niveau, qu'il soit basé sur des cartes 2.5D, la vision ou un agent VLA. L'intérêt pour les intégrateurs industriels est concret : la précision du placement des appuis conditionne l'ensemble des tâches loco-manipulation, soit la prochaine étape critique avant le déploiement d'humanoïdes dans les entrepôts et lignes de montage. En découplant le contrôleur bas niveau du planificateur, cette architecture permet de substituer l'algorithme de planification sans réentraîner la locomotion, un argument de modularité fort pour des déploiements multi-environnements. Les expériences en simulation et en transfert sim-to-real sur terrains complexes sont présentées comme concluantes, mais ce preprint non encore évalué par les pairs ne fournit pas de benchmark comparatif public ni de métriques de précision standardisées. Ce framework s'inscrit dans la continuité des travaux sur la locomotion bipède précise issus d'ETH Zurich, du MIT et de CMU, que les équipes commerciales (Boston Dynamics Atlas, Agility Robotics Digit, Unitree H1, Figure AI) cherchent à industrialiser. L'abstract ne précise pas la plateforme matérielle utilisée lors des tests réels, ce qui limite la reproductibilité des résultats. La prochaine étape logique serait une évaluation ouverte sur des robots nommément identifiés, assortie de métriques comparables aux approches concurrentes en planification de pas développées à l'EPFL ou à Carnegie Mellon.

UEL'EPFL est citée comme référence concurrente pour la planification de pas, ce qui signale la compétitivité des labos européens dans ce domaine, mais sans impact direct sur des acteurs ou institutions français.

HumanoïdesPaper
1 source
Dream-Tac : un modèle d'action monde tactile unifié pour la manipulation robotique riche en contacts
62arXiv cs.RO 

Dream-Tac : un modèle d'action monde tactile unifié pour la manipulation robotique riche en contacts

Des chercheurs ont publié le 9 juin 2026 sur arXiv (arXiv:2606.08737) Dream-Tac, un modèle d'action mondial unifié intégrant la modalité tactile pour la manipulation robotique en contact. L'architecture joint trois dimensions simultanément : la génération d'actions, la prédiction d'observations visuelles futures et la dynamique tactile. Deux contributions techniques structurent le système : une fusion visuotactile à déclenchement par contact ("contact-gated visuotactile fusion"), qui intègre sélectivement les signaux tactiles uniquement lors des phases d'interaction physique effective, et un biais d'attention conscient du contact ("contact-aware attention bias") régulant les échanges cross-modaux. Pour rendre le modèle déployable en temps réel, les auteurs introduisent une stratégie d'accélération à deux niveaux : reformulation du biais lors de l'entraînement pour préserver les chemins d'attention fusionnés, et accélération de la diffusion par cache à l'inférence. Résultat annoncé : entraînement 2,9 fois plus rapide, inférence 1,8 fois plus rapide. Sur six tâches de manipulation en contact riche, Dream-Tac améliore la précision des actions de 31,7 % en moyenne. Le code est publié sur GitHub. Le résultat le plus significatif n'est pas le chiffre brut des 31,7 %, mais ce qu'il révèle sur une limitation structurelle des modèles d'action mondiaux (world action models) actuels : ces architectures, qui héritent la capacité prédictive des world models pour guider la génération d'actions, s'appuient quasi exclusivement sur la vision. Or, la vision seule est insuffisante pour les tâches à fort contact (assemblage de pièces, vissage, insertion de connecteurs, manipulation d'objets souples) où les signaux critiques sont d'ordre haptique. Dream-Tac adresse directement ce "reality gap" tactile, en montrant que l'intégration conditionnelle de la modalité tactile dans le pipeline de diffusion améliore substantiellement la robustesse. Pour les intégrateurs industriels et les équipes robotique travaillant sur des cellules d'assemblage ou de finishing, c'est un signal clair que les VLA (Vision-Language-Action models) ne suffisent pas seuls pour les cas d'usage à contact. Le contexte est celui d'une compétition intense entre laboratoires sur la manipulation dextère. Physical Intelligence (pi0, pi0-FAST), Boston Dynamics, Figure AI et Agility Robotics investissent massivement dans des pipelines de manipulation généralisable, principalement visuels. Côté recherche académique, des travaux comme DexDiffuser ou UniDexGrasp ont posé les bases de la manipulation dextère par diffusion, mais sans intégration tactile unifiée. Dream-Tac s'inscrit dans une tendance émergente visant à enrichir ces pipelines avec des capteurs de contact (GelSight, Digit, BubbleGripper), encore peu intégrés dans les architectures de world models. Il s'agit ici d'un article de recherche arXiv, pas d'un produit ou d'un déploiement industriel : les six tâches de validation sont des benchmarks contrôlés en laboratoire, et la généralisation à des environnements réels non structurés reste à démontrer. Les prochaines étapes naturelles seraient une validation sur des plateformes hardware commerciales (UR, Franka, ou bras dextre humanoïde) et une extension à des gripper tactiles standardisés disponibles sur le marché.

RechercheOpinion
1 source
Un robot humanoïde gravit un volcan de 6 200 m, l'équipe vise ensuite l'Everest
63Interesting Engineering 

Un robot humanoïde gravit un volcan de 6 200 m, l'équipe vise ensuite l'Everest

Un robot humanoïde Unitree G1 modifié, baptisé "Pemba", a atteint le sommet du Chimborazo en Équateur le 7 juin 2026, soit 6 200 mètres d'altitude. L'expédition, conduite par l'ingénieur Pablo Berlanga Boemare et son entreprise Geologic Dome, s'est déroulée sur 16 heures. Pemba est une première étape d'un programme baptisé "Triple Crown" qui vise à terme l'ascension de l'Everest. À noter : le robot n'a pas grimpé en autonomie totale. Il a marché de manière indépendante sur les sections présentant une inclinaison inférieure à 30 degrés, mais a été porté par les membres de l'expédition sur les passages plus techniques. Les modifications matérielles incluent des systèmes de gestion thermique sur mesure et des équipements de ventilation intégrés aux vêtements protecteurs du robot, s'appuyant sur des tests antérieurs conduits dans la région chinoise d'Altay à des températures descendant jusqu'à -47,4°C. Ce projet répond à une question que les benchmarks en laboratoire ne peuvent pas trancher : un humanoïde peut-il opérer de manière utile dans des environnements extrêmes, là où les capteurs fixes sont coûteux à déployer et où les conditions mettent en danger les opérateurs humains ? Berlanga Boemare, ancien collaborateur du WWF dans le bassin du Congo et en Amazonie, articule le cas d'usage autour de la surveillance environnementale mobile : remplacer ou compléter des réseaux de caméras stationnaires par des plateformes autonomes capables de patrouiller de grandes surfaces, équipées de caméras, capteurs et connectivité satellite (Starlink est mentionné). Pour les décideurs B2B et les intégrateurs industriels, l'intérêt est ailleurs : il s'agit d'un premier jeu de données réel sur la résilience des batteries, la cinématique articulaire et le comportement thermique de l'électronique embarquée au-delà de 6 000 mètres, dans des conditions que les simulations ne modélisent pas fidèlement. Unitree Robotics, fabricant chinois du G1, s'est imposé ces deux dernières années comme un acteur de référence sur le segment des humanoïdes accessibles, face à Boston Dynamics, Figure AI et Agility Robotics qui ciblent davantage le marché industriel avec des machines nettement plus coûteuses. Geologic Dome ne s'inscrit pas dans cette course à la productivité d'entrepôt, mais ouvre un segment distinct : la robotique d'exploration et de surveillance environnementale en terrain hostile. La prochaine étape annoncée est l'Everest, en partenariat avec l'opérateur népalais Fourteen Peaks Expedition, avec un programme de test prévu entre le camp de base et le Camp IV (environ 8 000 mètres), couvrant performance des batteries, stress articulaire et collecte de données environnementales. Le projet bute cependant sur un obstacle réglementaire concret : le Népal ne dispose pas encore de cadre légal encadrant les expéditions robotiques sur l'Everest, et les autorités auraient demandé de nouvelles régulations avant toute autorisation.

HumanoïdesPaper
1 source
Video Friday : ce robot court dans les escaliers sans tomber
64IEEE Spectrum Robotics 

Video Friday : ce robot court dans les escaliers sans tomber

La sélection vidéo hebdomadaire d'IEEE Spectrum de début juin 2026 réunit plusieurs démonstrations robotiques aux profils contrastés. DEEP Robotics publie une vidéo d'un humanoïde récupérant son équilibre sur un escalier dans une séquence que les éditeurs du magazine jugent eux-mêmes impressionnante, tout en soulignant l'incertitude sur sa reproductibilité. La startup Generative Bionics annonce que GENE01, sa première plateforme humanoïde, est passée de la conception au lancement en production en série en seulement trois mois, avec deux configurations interchangeables de membres inférieurs et une couche baptisée "Physical AI" couvrant le contrôle moteur et la modélisation monde-action, sans qu'aucune métrique de charge utile, de degrés de liberté ni de temps de cycle n'accompagne l'annonce. IHMC Robotics présente Alex, son premier humanoïde entièrement développé en interne, qui a effectué ses premiers pas en extérieur sans attache lors d'une démonstration dans le Maryland. Flexiv Robotics dévoile le MICO, un système bimanuel compact sur la plateforme Enlight, orienté collaboration en espace de travail industriel partagé. À l'occasion de l'ICRA 2026, des chercheurs publient CCRobot-S dans IEEE Transactions on Robotics : une équipe de robots grimpeurs câbles reconfigurables capables d'inspecter et d'entretenir en opération parallèle les haubans de ponts à grande portée. Boston Dynamics contribue avec deux vidéos, l'une sur des pieds interchangeables pour Atlas, l'autre montrant le robot apprendre à jouer au football. La revendication la plus saillante de cette sélection est le délai de trois mois de Generative Bionics entre conception et production en série. Si elle se confirme, elle signalerait une compression radicale des cycles de développement matériel dans la robotique humanoïde, un secteur qui exige habituellement plusieurs années d'itération. L'absence de spécifications techniques rend l'évaluation indépendante impossible à ce stade : l'annonce ressemble davantage à une opération de visibilité qu'à une divulgation produit. Les essais en extérieur d'IHMC avec Alex sont une contribution plus modeste mais techniquement crédible : sortir du laboratoire vers un environnement non structuré reste l'un des tests les plus rigoureux de la robustesse locomotrice, et l'un des plus rares à être documentés publiquement, adressant directement le demo-to-reality gap qui frappe de nombreuses démonstrations du secteur. CCRobot-S illustre une autre dynamique, celle des applications robotiques collaboratives à vocation industrielle précise, portées par des contraintes de sécurité et de régulation réelles dans le domaine des infrastructures. Le paysage concurrentiel des humanoïdes reste dense. Figure AI a livré le Figure 03, Tesla teste l'Optimus Gen 3 en production, le modèle VLA pi0 de Physical Intelligence structure plusieurs pilotes commerciaux, et le Digit d'Agility Robotics est déployé dans des entrepôts Amazon. L'Atlas de Boston Dynamics, malgré ses qualités mécaniques, n'a pas encore établi de trajectoire commerciale clairement définie, et les vidéos football semblent davantage viser la notoriété grand public que l'intégration industrielle. IHMC Robotics, laboratoire affilié à Florida International University, a historiquement alimenté l'écosystème en infrastructures et en talents plutôt qu'en produits commerciaux directs. Generative Bionics est un nom nouveau dans le secteur et mérite un suivi si de prochaines publications techniques viennent étayer la revendication des trois mois. Aucun acteur européen n'apparaît directement dans cette sélection, bien qu'Enchanted Tools, Wandercraft et Pollen Robotics restent actifs sur leurs segments respectifs.

HumanoïdesActu
1 source
IA incarnée sûre pour les tâches à long horizon : une analyse multi-couches de la manipulation robotique
65arXiv cs.RO 

IA incarnée sûre pour les tâches à long horizon : une analyse multi-couches de la manipulation robotique

Une équipe de chercheurs publie sur arXiv (identifiant 2606.05660, juin 2026) une revue systématique de la sécurité dans les systèmes d'IA incarnée (embodied AI) appliqués à la manipulation robotique à long horizon. Ce survey structure la littérature selon trois niveaux d'intervention : la sécurité au stade de la planification (planning-time), au niveau de la politique de contrôle (policy-time) et pendant l'exécution (execution-time). Les auteurs identifient quatre vecteurs de risque pouvant s'accumuler dans un même système en boucle fermée : le misgrounding sémantique (l'agent interprète mal l'instruction de haut niveau), la propagation d'erreur entre sous-tâches, la dérive d'exécution (execution drift) et les risques physiques liés aux contacts. Ils distinguent par ailleurs trois catégories de garanties dans la littérature existante : formelles, statistiques et heuristiques empiriques, et concluent que les preuves formelles font défaut à chaque couche. L'enjeu est direct pour les intégrateurs et les décideurs industriels. Un bras robotique déployé en entrepôt ou en ligne de production enchaîne des dizaines d'actions sur des horizons temporels étendus, et chaque sous-tâche peut propager silencieusement une erreur vers les suivantes. Or le survey révèle que la sécurité au niveau de la politique de contrôle, au coeur même des modèles VLA (Vision-Language-Action) comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, est la couche la moins documentée empiriquement. Les mécanismes d'intervention déclenchés par l'incertitude (uncertainty-triggered intervention) restent immatures, et les benchmarks spécifiques à la sécurité en manipulation longue durée sont quasi-inexistants, ce qui rend toute validation rigoureuse avant déploiement aujourd'hui difficile. Ce travail paraît dans un contexte d'accélération industrielle : Figure AI, Boston Dynamics, Unitree et Physical Intelligence multiplient les démonstrations de manipulation dextère, souvent en conditions semi-contrôlées, alimentant un écart potentiel entre annonces marketing et réalité opérationnelle. Il convient de souligner que ce papier est une analyse critique de l'existant, pas un nouveau système ou algorithme. Ses recommandations prioritaires portent sur trois axes : des assurances cross-couche cohérentes de la planification jusqu'à l'exécution physique, des benchmarks dédiés à la sécurité en manipulation longue durée, et des protocoles de déploiement progressifs pour les agents robotiques en environnements réels. En creux, le constat est que les capacités du secteur progressent plus vite que les outils pour en évaluer la sécurité.

UEL'absence de benchmarks formels de sécurité pour la manipulation longue durée concerne directement les industriels européens déployant des bras robotisés, et pourrait alimenter les exigences de validation dans le cadre de l'AI Act pour les systèmes robotiques à haut risque.

RecherchePaper
1 source
Le public américain acclame les robots dansants Unitree pendant que le Congrès cherche à les interdire
66SCMP Tech 

Le public américain acclame les robots dansants Unitree pendant que le Congrès cherche à les interdire

Les robots humanoïdes G1 du fabricant chinois Unitree Robotics ont fait une apparition remarquée dans le show télévisé américain America's Got Talent lors du lancement de sa nouvelle saison, décrochant une ovation debout du public en studio. La performance, diffusée en prime time sur une chaîne nationale américaine, a suscité une adhésion populaire immédiate selon les analystes du secteur, même si les chiffres d'audience définitifs n'ont pas encore été communiqués. Le G1 est un humanoïde bipède commercialisé par Unitree à environ 16 000 dollars, positionné comme l'une des plateformes humanoïdes les moins chères du marché mondial. Ce contraste entre l'enthousiasme du grand public et la méfiance des élus illustre une tension structurelle croissante dans le secteur robotique américain. Alors que des législateurs au Congrès examinent des projets de loi visant à restreindre ou interdire l'utilisation de robots et composants d'origine chinoise dans les infrastructures critiques, une exposition télévisée à grande échelle normalise ces mêmes machines auprès de dizaines de millions de foyers. Pour les décideurs industriels et les intégrateurs, ce clivage complique les arbitrages d'approvisionnement : les plateformes chinoises restent attractives sur le plan tarifaire mais exposent à un risque réglementaire croissant. Unitree a connu une montée en puissance rapide, passant des robots quadrupèdes bon marché (série Go) aux humanoïdes G1 et H1. La société s'impose comme le pendant grand public de Figure AI, Agility Robotics ou Boston Dynamics sur le segment entrée de gamme. Les tentatives législatives américaines de restreindre les robots chinois s'inscrivent dans la continuité des régulations visant Huawei ou DJI, et pourraient accélérer la demande pour des alternatives domestiques comme Apptronik ou Sanctuary AI si elles aboutissent.

UELes intégrateurs européens utilisant des plateformes Unitree s'exposent à un risque réglementaire croissant si l'UE s'aligne sur la trajectoire législative américaine, sur le modèle des restrictions DJI/Huawei.

Chine/AsieOpinion
1 source
CoRe-MoE : un mélange d'experts contrastif pour la locomotion multi-terrain des robots humanoïdes avec adaptation de la démarche
67arXiv cs.RO 

CoRe-MoE : un mélange d'experts contrastif pour la locomotion multi-terrain des robots humanoïdes avec adaptation de la démarche

Une équipe de recherche publie sur arXiv (2606.04718) CoRe-MoE, un framework d'apprentissage par renforcement en deux étapes conçu pour permettre à un robot humanoïde de marcher et de courir sur des terrains variés sans politique distincte par surface. L'architecture repose sur un Mixture-of-Experts (MoE) augmenté d'un objectif contrastif : une première phase entraîne une politique de locomotion de base produisant marche et course avec transitions fluides, puis une seconde phase greffe une branche MoE sensible au terrain, dont le réseau de gating est formé à distinguer structurellement les représentations de sol. L'action finale est une fusion pondérée entre la politique de base et la branche adaptative. Validé en simulation puis déployé en zero-shot sur le Unitree G1, le système traverse escaliers, rampes, marches, obstacles et terrains extérieurs non structurés tout en maintenant un placement de pied précis face à des perturbations externes. L'intérêt de ce travail pour les intégrateurs et décideurs robotiques tient moins à la performance brute qu'à la méthode de découplage. Le problème classique dans l'entraînement multi-tâches est l'interférence de gradients : une politique unifiée marche/course/terrain provoque des conflits d'apprentissage qui dégradent chaque sous-compétence. CoRe-MoE contourne cela en séparant explicitement génération de démarche et adaptation terrain. L'objectif contrastif force une spécialisation claire des experts MoE, défaillance récurrente des implémentations MoE naïves. Le zero-shot sim-to-real sur G1 suggère une réduction du reality gap, point de friction central dans le passage de la simulation au déploiement industriel, bien que le papier ne fournisse pas de métriques de cycle ou de données de déploiement à l'échelle. Le Unitree G1 est un humanoïde 23 degrés de liberté à environ 16 000 dollars, devenu référence de facto pour la recherche en locomotion académique, face au Boston Dynamics Atlas et à l'Agility Robotics Digit plus orientés industrie. CoRe-MoE s'inscrit dans un courant actif de politiques visuomotrices pour humanoïdes, aux côtés de travaux comme GR00T N2 de NVIDIA ou Pi-0 de Physical Intelligence, qui cherchent tous à unifier mobilité et manipulation sous une seule politique généraliste. La prochaine étape naturelle de ce type d'architecture est l'extension aux tâches de manipulation en locomotion, et le test sur des humanoïdes plus lourds à charge utile élevée, où la stabilité dynamique devient critique.

IA physiqueOpinion
1 source
Un fabricant shanghaïen dévoile un robot humanoïde de 1,2 m à double cerveau et design compact
68Interesting Engineering 

Un fabricant shanghaïen dévoile un robot humanoïde de 1,2 m à double cerveau et design compact

JAKA Robotics, société shanghaïenne fondée en 2015 et jusqu'ici connue pour ses cobots industriels, a dévoilé le Pi, un robot humanoïde compact mesurant 1,22 mètre pour 42 kilogrammes. La plateforme intègre 27 degrés de liberté grâce à des modules articulaires intégrés de nouvelle génération, annoncés 15 à 27 % plus compacts que la génération précédente. Les genoux développent jusqu'à 120 Nm de couple pour la locomotion, et chaque bras supporte une charge utile de 3 kilogrammes. L'architecture de contrôle repose sur une plateforme Intel hétérogène à double domaine : un "cerveau" chargé du raisonnement IA, de la perception visuelle, des grands modèles de langage et de la logique applicative, et un "cervelet" dédié au contrôle moteur temps réel via un réseau EtherCAT à latence milliseconde. JAKA présente le Pi comme une plateforme de R&D pour l'intelligence incarnée et l'interaction homme-robot, sans annoncer de déploiement commercial ni de calendrier de production. La principale valeur technique du Pi réside dans son architecture duale, qui sépare explicitement l'inférence IA du contrôle déterministe -- une approche que l'on retrouve chez plusieurs concurrents mais que JAKA documente ici avec des métriques d'intégration concrètes. Pour un intégrateur ou un décideur industriel, la compacité (42 kg, 1,22 m) et le payload de 3 kg par bras positionnent le Pi sur un segment intermédiaire entre les humanoïdes de taille adulte comme Figure 03 ou Tesla Optimus Gen 3 et les plateformes de table. En revanche, les performances annoncées restent à ce stade des spécifications constructeur: aucune vidéo de tâche en conditions réelles n'a été publiée, et la notion de "polyvalence applicative" n'est étayée par aucun benchmark reproductible ni site pilote identifié. JAKA s'est construit sur dix ans une gamme cobot industrielle étendue -- séries Zu (3 à 30 kg), Pro (IP68, milieux hostiles), S Series (contrôle en force), AL/A Series (vision intégrée) -- avant d'amorcer un pivot vers l'intelligence incarnée avec ses humanoïdes K1, K1L et K1W. Le Pi s'inscrit dans cette trajectoire de montée en gamme vers des systèmes IA embarqués. Sur le plan concurrentiel, le marché humanoïde compact est déjà occupé par Unitree (G1, 1,27 m, 35 kg), Agility Robotics (Digit), et côté recherche par des plateformes comme le PR2 ou l'Atlas de Boston Dynamics. En Chine, des acteurs comme Fourier Intelligence ou UBTech développent également des humanoïdes à vocation industrielle. La Chine déploie par ailleurs des robots humanoïdes dans la logistique postale, notamment à Guangzhou, signal d'un marché domestique qui commence à absorber ces systèmes. JAKA n'a pas communiqué de prix, ni de partenaires industriels, ni de calendrier pour des pilotes commerciaux du Pi.

HumanoïdesOpinion
1 source
Transfert de style de mouvement humain pour le contrôle physique de robots humanoïdes
69arXiv cs.RO 

Transfert de style de mouvement humain pour le contrôle physique de robots humanoïdes

Un groupe de chercheurs présente dans un preprint arXiv (2606.03536, soumis le 3 juin 2026) un framework de transfert de style de mouvement pour robots humanoïdes. Le système prend en entrée un court clip humain illustrant un style moteur désiré (rythme de marche, balancement des bras, posture) et un mouvement cible distinct, puis génère un mouvement corps entier stylisé adapté au robot. Le modèle central est un modèle de diffusion latente multi-condition, sensible à la physique, fusionnant conditions de style, de contenu et de trajectoire. La guidance classifier-free permet d'ajuster l'intensité du style sans réentraîner le modèle. Les références générées sont ensuite converties pour le robot Unitree G1 et exécutées par une politique de suivi corps entier entraînée via une stratégie "cluster-and-distill". Sur 125 essais sur robot réel, la méthode atteint un taux de réussite de 96,0 %, avec moins d'artefacts de contact et de jitter que les baselines orientées animation. Ce résultat remet en question le paradigme dominant où chaque comportement expressif d'un humanoïde est soit capturé en démonstration directe, soit scripté manuellement, deux approches coûteuses et non réutilisables entre contenus de mouvement différents. En permettant à un court clip humain de servir de source de style transférable sur des contenus arbitraires, le framework ouvre la voie à une personnalisation motrice procédurale. L'écart simulation-hardware est adressé directement par des régularisations de cohérence de contact et de lissage temporel imposées lors de l'entraînement, un point de friction récurrent dans la chaîne génération-contrôle. Un taux de 96 % sur 125 essais réels représente un résultat solide pour de la recherche académique dans ce domaine, où beaucoup de travaux restent confinés à la simulation. Le Unitree G1 (environ 16 000 dollars) s'est imposé ces 18 derniers mois comme la plateforme de référence pour la recherche humanoïde académique. Ces travaux s'inscrivent dans la tendance des modèles de diffusion appliqués à la génération de mouvement (MDM, MotionDiffuse), prolongée ici jusqu'au contrôle physique sur hardware réel. Dans la course à l'expression motrice des humanoïdes, Boston Dynamics (Atlas), Figure et 1X investissent massivement côté imitation learning et VLA end-to-end, tandis que ce preprint se positionne sur la génération procédurale contrôlée, approche complémentaire. Du côté européen, Wandercraft et Enchanted Tools (France, robot Mirokaï) travaillent sur des problématiques d'expression motrice proches, sur des architectures distinctes. La suite logique serait l'intégration de ce framework dans des pipelines de téléopération ou d'interfaces humain-robot en conditions industrielles réelles.

UEWandercraft et Enchanted Tools (France) travaillent sur des problématiques d'expression motrice similaires et pourraient s'inspirer de cette approche de transfert de style procédural sur hardware réel.

HumanoïdesPaper
1 source
OpenEAI-Platform : une plateforme open source unifiée matériel-logiciel pour l'IA incarnée
70arXiv cs.RO 

OpenEAI-Platform : une plateforme open source unifiée matériel-logiciel pour l'IA incarnée

Des chercheurs ont déposé sur arXiv (2606.03392) OpenEAI-Platform, une plateforme open-source couplant un bras robotique à 6+1 degrés de liberté (DDL), OpenEAI-Arm, et un modèle vision-langage-action (VLA), OpenEAI-VLA. OpenEAI-Arm s'appuie sur des plans mécaniques ouverts et une commande conforme (compliant control) destinée à réduire le coût de fabrication tout en maintenant la précision de manipulation. OpenEAI-VLA est construit sur Qwen3-VL-4B d'Alibaba avec une tête d'action Diffusion Transformer, entraîné en deux phases sur des jeux de données exclusivement ouverts. Sur quatre tâches de manipulation réelles, il atteint des taux de réussite comparables à pi0 de Physical Intelligence, un modèle pré-entraîné à bien plus grande échelle. OpenEAI-Arm surpasse par ailleurs deux bras commerciaux 6+1 DDL évalués sous la même politique de contrôle. Plans, codes, modèles et pipelines d'entraînement seront publiés intégralement après acceptation de l'article en revue. L'intérêt de ces résultats est double. Côté hardware, un bras open-source moins coûteux qui surpasse des équipements commerciaux constitue un levier direct pour les laboratoires et intégrateurs à budget contraint. Côté VLA, approcher les performances de pi0 avec nettement moins de données de pré-entraînement conteste l'hypothèse selon laquelle des politiques de manipulation robustes nécessitent impérativement des corpus massifs et propriétaires. L'architecture combinant un modèle vision-langage compact (4 milliards de paramètres) et une tête diffusion semble offrir un rapport performance-données plus favorable que prévu, ce qui intéresse directement les équipes cherchant à déployer des robots polyvalents sans infrastructure de collecte industrielle. OpenEAI-VLA s'appuie sur Qwen3-VL-4B (Alibaba, 2025) et l'architecture Diffusion Transformer popularisée par pi0 (Physical Intelligence, 2024) pour générer des actions robotiques continues. La plateforme s'inscrit dans un segment croissant de projets ouverts pour la manipulation, aux côtés de LeRobot (Hugging Face) et ALOHA (Stanford), face à des acteurs commerciaux comme Figure AI, Boston Dynamics ou 1X Technologies. Son positionnement vise explicitement la reproductibilité et la collecte de données à l'échelle, deux goulots d'étranglement identifiés par la communauté robotique. Aucun déploiement industriel ni partenariat n'est annoncé : OpenEAI-Platform est un prétirage, et l'accès aux ressources complètes reste conditionnel à l'acceptation de l'article.

UELes équipes de recherche et laboratoires européens à budget contraint pourraient exploiter cette plateforme matériel-logiciel open source pour accélérer leurs travaux en manipulation robotique sans infrastructure de collecte de données industrielle.

💬 Un bras robot open-source qui surpasse du hardware commercial, c'est déjà solide. Ce qui m'intéresse encore plus, c'est que leur VLA s'approche des perfs de pi0 avec des datasets entièrement ouverts et un modèle à 4B paramètres, ce qui fracasse l'idée qu'il faut absolument un corpus propriétaire massif pour faire de la manipulation sérieuse. Bon, c'est un prétirage pour l'instant, les ressources complètes sortent après acceptation de l'article.

IA physiqueOpinion
1 source
SplitAdapter : loco-manipulation humanoïde sensible à la charge par adaptation factorisée
71arXiv cs.RO 

SplitAdapter : loco-manipulation humanoïde sensible à la charge par adaptation factorisée

SplitAdapter est une architecture présentée sur arXiv (identifiant 2606.03297) visant à améliorer le contrôle de robots humanoïdes en loco-manipulation, soit la combinaison simultanée de la marche bipède et de la manipulation d'objets physiques. Le système part d'une politique de manipulation de boîtes préentraînée qu'il fige, puis lui greffe deux encodeurs de contexte indépendants : l'un capture les propriétés de la charge et de l'objet saisi, l'autre modélise les dynamiques internes du robot. Ces représentations sont injectées via une modulation FiLM hiérarchique (Feature-wise Linear Modulation), combinée à des objectifs split world-model et une régularisation cross-adversariale par gradient reversal (GRL). Les expériences couvrent des objets de 2, 4 et 6 kg, à des hauteurs de prise et de dépôt de 0, 30 et 60 cm, testés en sim-to-sim puis en déploiement sur robot réel. SplitAdapter améliore le taux de succès en tâche complète face à la politique de base et aux baselines FiLM à encodeur unique, avec les gains les plus marqués sous forte charge (6 kg). L'enjeu central est le transfert sim-to-réel sous charge variable : lorsqu'un humanoïde soulève un objet lourd, ses dynamiques changent sensiblement, et les adaptateurs existants qui fusionnent tous les signaux dans une seule représentation latente tendent à perdre en robustesse précisément dans les conditions les plus critiques. La factorisation proposée, un encodeur par source de variation, maintient une séparation explicite entre les incertitudes liées à l'objet et celles liées au robot, ce qui se révèle plus stable sous conditions extrêmes. Pour un intégrateur ou un OEM industriel, cela suggère qu'une politique généraliste préentraînée peut être adaptée modulairement selon la charge sans réentraînement complet, une propriété utile pour des lignes de production où les objets manipulés varient fréquemment. La loco-manipulation sur humanoïdes concentre des investissements massifs : Figure AI déploie son Figure 03 chez BMW, Boston Dynamics pousse Atlas en partenariat avec Hyundai, et des labos comme Physical Intelligence (Pi-0) ou NVIDIA (GR00T N2) misent sur des politiques généralisables de type VLA (Vision-Language-Action). SplitAdapter prend un pari différent, adapter une politique spécialisée existante plutôt que d'en entraîner une nouvelle de bout en bout, ce qui réduit les coûts de calcul mais soulève la question de la généralisabilité hors distribution. Le papier est une préimpression arXiv soumise début juin 2026, non encore évaluée par les pairs ; aucun déploiement industriel ni pilote commercial n'est annoncé à ce stade.

IA physiquePaper
1 source
Dyno, le premier robot humanoïde du Vietnam, cible la sécurité et les tâches domestiques
72Interesting Engineering 

Dyno, le premier robot humanoïde du Vietnam, cible la sécurité et les tâches domestiques

VinDynamics, filiale robotique du conglomérat vietnamien Vingroup (connu pour VinFast dans l'automobile et VinAI dans l'intelligence artificielle), a présenté Dyno lors de l'ICRA 2026 à Vienne et du Computex Taipei 2026, marquant l'entrée officielle du Vietnam dans la course aux humanoïdes. Le robot est conçu pour deux segments initiaux: la sécurité et la surveillance dans les espaces urbains et commerciaux, et l'assistance domestique. Un déploiement pilote a déjà eu lieu à Vinpearl Safari Phu Quoc, en conditions extérieures, où Dyno a opéré comme guide multilingue autonome, capable d'interaction en langage naturel et de perception environnementale en temps réel. Sur le plan des composants, VinDynamics expose également l'actionneur VDM 80, un joint compact de moins d'un kilogramme, tournant jusqu'à 235 rpm sous 48V, compatible CAN FD, RS485 et EtherCAT, avec une durée de vie annoncée supérieure à 10 000 heures. La main robotique associée intègre 11 articulations mobiles et 6 degrés de liberté activement contrôlés, avec capteurs de force intégrés. Les spécifications globales du robot (payload, nombre total de DOF, autonomie énergétique) n'ont pas encore été publiées. Ce lancement positionne VinDynamics comme le premier acteur sud-est-asiatique à entrer publiquement dans le segment humanoïde full-body, dans un marché jusqu'ici dominé par des entreprises américaines et chinoises. La stratégie modulaire est notable: en exposant séparément l'actionneur, la main et la plateforme d'entraînement IA, l'entreprise signale une ambition B2B de fournisseur de composants en plus du robot complet, une approche similaire à celle adoptée par des acteurs comme Robosense ou Fourier Intelligence. Le déploiement à Vinpearl constitue une preuve d'exploitation réelle en environnement non contrôlé, ce qui le distingue d'une simple démonstration de laboratoire. Cela dit, l'absence de métriques précises sur les performances du robot principal (vitesse de marche, charge utile, taux de succès sur les tâches de manipulation) rend difficile toute comparaison directe avec les plateformes concurrentes. Dyno reste à ce stade une annonce structurée autour d'un pilote et d'une roadmap de composants, pas encore un produit commercialement disponible. Vingroup est l'un des plus grands conglomérats privés d'Asie du Sud-Est, avec des investissements massifs en R&D technologique depuis 2019 via VinAI Research. VinDynamics s'inscrit dans cette diversification vers la robotique physique. Sur le marché humanoïde global, les concurrents directs incluent Figure (Figure 02 déployé chez BMW), Tesla (Optimus Gen 3 en production), Boston Dynamics (Atlas en phase commerciale), Agility Robotics (Digit chez Amazon), ainsi que les acteurs chinois Unitree, Fourier et AgiBot. La présentation à l'ICRA 2026 est une démarche de légitimation académique et industrielle internationale. Les prochaines étapes annoncées incluent des déploiements commerciaux supplémentaires, sans calendrier précis communiqué.

Chine/AsieOpinion
1 source
JAKA Robotics dévoile JAKA Pi, un robot humanoïde compact de 1,22 m pour l'éducation et les services
73Pandaily 

JAKA Robotics dévoile JAKA Pi, un robot humanoïde compact de 1,22 m pour l'éducation et les services

JAKA Robotics, fabricant shanghaïen de robots collaboratifs industriels basé dans le district de Minhang, a présenté le JAKA Pi, un robot humanoïde compact de 1,22 mètre pour 42 kilogrammes. Le système embarque 27 degrés de liberté, avec des modules articulaires 15 à 27 % plus petits en diamètre que la génération précédente. L'articulation du genou délivre 120 Nm de couple pour assurer une locomotion stable, et chaque bras supporte une charge utile de 3 kg pour des tâches de manipulation légère. L'encombrement global est contenu à 1 220 x 420 x 220 mm. L'architecture de contrôle, baptisée "fusion brain" par l'entreprise, repose sur la plateforme de calcul hétérogène Intel et sépare deux domaines distincts : un "cerveau" supérieur dédié au raisonnement IA, aux algorithmes de vision et aux modèles de langage, et un "cervelet" gérant le contrôle moteur temps réel via bus EtherCAT à latence milliseconde. Le produit est présenté comme disponible, mais aucun chiffre de déploiement ni de prix public n'a été communiqué lors de ce lancement. La transition d'un spécialiste des cobots industriels vers un humanoïde de service constitue un signal stratégique notable, même si le positionnement retenu, axé sur l'éducation, la recherche universitaire, l'animation d'expositions et l'accompagnement des personnes âgées, reste dans un segment à faible exigence de fiabilité opérationnelle comparé aux applications logistiques ou manufacturières. La séparation architecturale entre couche IA et couche temps réel via EtherCAT est une approche déjà adoptée par d'autres acteurs du secteur pour résoudre la tension entre latence de l'inférence LLM et déterminisme du contrôle moteur, et représente une décision d'ingénierie sensée plutôt qu'une rupture. La valeur du JAKA Pi pour les intégrateurs et les équipes R&D réside davantage dans sa compacité et dans sa plateforme de développement secondaire ouverte que dans des performances mécaniques exceptionnelles, son payload de 3 kg par bras le plaçant dans une catégorie intermédiaire entre les démonstrateurs de laboratoire et les solutions industrielles. JAKA Robotics a officiellement repositionné sa marque en 2025, abandonnant l'étiquette de fabricant de robots collaboratifs pour celle de société de "robotique intelligente généraliste", et a formalisé un partenariat avec l'Université Jiao Tong de Shanghai pour un centre de recherche conjoint sur l'intelligence incarnée et les systèmes de perception avancée. Le marché des humanoïdes compacts pour l'éducation et le service voit coexister des acteurs très différents : Unitree (H1, G1), Agility Robotics (Digit), Boston Dynamics (Atlas), ainsi que des startups chinoises comme Fourier Intelligence ou Agibot, sans oublier Figure et 1X en Occident. À ce stade, le JAKA Pi s'inscrit davantage comme une annonce de positionnement stratégique que comme un produit à déploiement industriel imminent, en l'absence de données de terrain ou de pilotes clients confirmés.

HumanoïdesOpinion
1 source
URDF-Anything+ : génération bout-en-bout d'actifs articulés prêts pour la simulation
74arXiv cs.RO 

URDF-Anything+ : génération bout-en-bout d'actifs articulés prêts pour la simulation

Une équipe de chercheurs a publié sur arXiv en mars 2026 URDF-Anything+, un modèle de diffusion autorégressive générant des fichiers URDF (Unified Robot Description Format) à partir d'une seule image RGB. Le URDF est le format standard dans l'écosystème ROS et les simulateurs physiques (MuJoCo, Isaac Sim, Gazebo) pour décrire la géométrie et la cinématique des objets articulés. Le système opère dans un espace latent structuré et prédit séquentiellement chaque partie de l'objet avec ses paramètres de joint (type, axe, limites de mouvement), un token de terminaison déterminant dynamiquement le nombre de segments à générer. Évalué sur des benchmarks à grande échelle d'objets articulés, il surpasse les méthodes existantes en reconstruction géométrique, en précision des paramètres de joints et en "physical executability", soit la capacité des URDF produits à s'exécuter directement dans un simulateur sans post-traitement manuel. L'enjeu pour les roboticiens et ingénieurs de simulation est direct : produire des digital twins d'objets articulés réels (tiroirs, portes, vannes, équipements industriels) reste un goulot d'étranglement dans les pipelines de sim-to-real. Les approches classiques imposent segmentation manuelle, retrieval depuis des bibliothèques 3D (PartNet, ShapeNet) ou des pipelines multi-étapes coûteux à maintenir. URDF-Anything+ compresse ce processus en une passe unique, sans retrieval ni post-traitement externe. Le résultat le plus significatif est le transfert zero-shot : des politiques de manipulation entraînées exclusivement en simulation sur des URDF générés ont été transférées dans des environnements réels sans fine-tuning supplémentaire, ce qui constitue une validation directe que le sim-to-real gap sur les objets articulés peut être partiellement absorbé par la fidélité du jumeau numérique. La reconstruction d'objets articulés depuis des observations visuelles est un problème ouvert depuis plus d'une décennie. Des travaux antérieurs comme PARIS, ArticulatedFormer et NSM avaient progressé sur la segmentation et l'estimation cinématique, mais butaient sur la généralisation et l'utilisabilité directe en simulateur. URDF-Anything+ s'inscrit dans la tendance des modèles génératifs 3D orientés simulation, aux côtés des Gaussian Splattings dynamiques et des NeRF articulés. La recherche (arXiv:2603.14010) ne mentionne pas d'affiliation industrielle ni de plan de commercialisation : il s'agit d'un résultat purement académique. L'intégration naturelle serait dans les pipelines de génération de données synthétiques pour la manipulation robotique, domaine où Physical Intelligence, le Boston Dynamics AI Institute et les équipes Nvidia Isaac Lab investissent massivement en ce moment.

UELes équipes académiques européennes en manipulation robotique (INRIA, DLR, TU Munich) pourraient intégrer cet outil dans leurs pipelines de données synthétiques, mais aucun acteur français ou européen n'est directement impliqué.

RecherchePaper
1 source
Suivi corporel intégral contraint pour robots humanoïdes
75arXiv cs.RO 

Suivi corporel intégral contraint pour robots humanoïdes

Des chercheurs ont publié sur arXiv (2606.00374) un framework de contrôle baptisé ConstrainedMimic, conçu pour imposer des contraintes de sécurité en temps réel sur des robots humanoïdes pilotés par apprentissage par renforcement. La démonstration s'appuie sur un Unitree G1 simulé : le système fait tourner la politique de suivi de mouvement whole-body à 300-500 Hz, indifféremment sur CPU, GPU ou TPU, tout en garantissant simultanément l'évitement de collisions (auto-collisions et obstacles externes), le respect des butées articulaires et la stabilité du centre de masse. Les expériences couvrent le suivi de mouvements cinématiques référencés et la téléopération. Le code sera libéré à la publication. L'enjeu sous-jacent est structurant pour l'industrialisation des humanoïdes : les politiques RL apprennent des comportements agiles mais ne savent pas, par défaut, respecter des contraintes ajoutées après entraînement, ce qui bloque le déploiement dans des environnements où les exigences de sécurité évoluent (cellule de travail reconfigurée, proximité opérateur, certification CE). ConstrainedMimic répond à ce problème en combinant deux outils de contrôle classiques, le contrôle en espace opérationnel (OSC) et les control barrier functions (CBF), pour projeter la commande du réseau de neurones dans un espace faisable respectant les contraintes actives. La méthode est entièrement différentiable et n'altère la politique que le strict minimum lorsqu'une contrainte entre en jeu, ce qui la distingue des approches d'override brutales. C'est un pas vers la séparation propre entre performance et sécurité dans les pipelines RL pour humanoïdes. Le sujet s'inscrit dans une course active à la robustesse des politiques whole-body : Figure (Figure 02/03), Boston Dynamics (Atlas), Agility Robotics (Digit) et Unitree investissent massivement en RL locomotion, mais la question des garanties formelles reste un angle mort industriel. Les CBF sont bien établies en robotique mobile (AMR, véhicules autonomes) mais leur intégration dans des politiques RL pour humanoïdes à haute dimension cinématique est encore exploratoire. À noter : l'évaluation reste entièrement en simulation, ce qui laisse ouverte la question du sim-to-real gap sur les contraintes dynamiques, un point que les auteurs n'adressent pas dans cet abstract. La publication du code facilitera la reproductibilité et pourrait accélérer l'adoption dans des labos comme le DLR, l'INRIA ou des intégrateurs industriels européens travaillant sur la certification de robots collaboratifs.

UELa publication du code pourrait permettre à des laboratoires européens comme l'INRIA ou le DLR d'intégrer des garanties formelles de sécurité dans leurs pipelines RL pour humanoïdes, facilitant la certification CE de robots collaboratifs en environnement industriel partagé.

HumanoïdesPaper
1 source
7 robots inspirés du vivant qui relèvent de vrais défis d'ingénierie
76Interesting Engineering 

7 robots inspirés du vivant qui relèvent de vrais défis d'ingénierie

Six familles de robots à morphologie animale concentrent une part croissante des efforts en robotique appliquée, couvrant des secteurs aussi divers que l'inspection industrielle, le sauvetage en catastrophe, la maintenance offshore et l'aquaculture. Le quadrupède Spot, commercialisé par Boston Dynamics, est déjà opérationnel dans des centrales électriques, des installations pétrolières et des chantiers pour des missions de surveillance en environnement dangereux. Les robots serpents, dotés de corps segmentés articulés, ont été testés par des équipes de recherche et des équipes de secours pour localiser des survivants dans des décombres post-séisme, là où les plateformes conventionnelles ne peuvent pas pénétrer. Des robots grimpeurs reproduisent les micro-structures adhésives des pattes de gecko pour inspecter verticalement ponts et infrastructures. En milieu offshore, le robot Eelume, développé par la spin-off NTNU éponyme soutenue par Equinor et Kongsberg, adopte la locomotion ondulatoire de l'anguille pour inspecter pipelines et plateformes en restant déployé durablement sous l'eau. Des chercheurs du CIRTESU (Centre de recherche en robotique et technologies sous-marines) de l'Universitat Jaume I ont récemment testé à PortCastelló un poisson-robot biomimétique à propulsion par nageoires, sans hélices, équipé de sonar et de systèmes de vision, pour surveiller les filets de fermes aquacoles. Le laboratoire CREATE de l'EPFL a par ailleurs présenté un bras souple reposant sur une structure d'hélicoïde tronqué (trimmed helicoid), inspirée de la trompe d'éléphant et des tentacules de pieuvre, qui module rigidité et flexibilité localement pour permettre une manipulation délicate en contexte co-robotique. Ces plateformes répondent à des problèmes industriels documentés, pas à des curiosités de laboratoire. Eelume modifie structurellement l'économie de la maintenance offshore : là où un ROV traditionnel nécessite un navire de surface et dépend de la météo, un système résident opère en continu, réduisant les coûts d'intervention. La propulsion par nageoires du robot valencien surpasse les hélices en discrétion et efficacité énergétique dans les milieux aquacoles. Spot constitue le cas commercial le plus avancé de la tendance, Boston Dynamics ayant livré plusieurs centaines d'unités à des industriels. Pour les autres familles, notamment les robots serpents, les tests restent majoritairement conduits en environnements contrôlés : le fossé sim-to-real pour des décombres réels n'est pas résolu. L'approche soft robotics de l'EPFL illustre une stratégie alternative : intégrer la compliance mécanique dans la conception plutôt que de la gérer par contrôle actif, ce qui simplifie considérablement l'implémentation en environnement co-robotique. Boston Dynamics développe Spot depuis les travaux fondateurs de Marc Raibert au MIT ; l'entreprise a été rachetée par Hyundai en 2021 pour 1,1 milliard de dollars. Sur le segment quadrupède, la concurrence est vive : ANYbotics (ANYmal), Unitree (Go2, H1) et Ghost Robotics (Vision 60) ciblent les mêmes marchés industriels avec des positionnements prix différenciés. Eelume opère sur le marché oil & gas depuis plusieurs années avec le soutien de majors du secteur. En Europe, Pollen Robotics et Enchanted Tools développent des architectures à inspiration biologique, mais restent peu positionnés sur ces créneaux applicatifs précis. L'aquaculture robotisée bénéficie de financements croissants dans le cadre du Blue Deal européen, ce qui devrait accélérer les déploiements à l'image du projet de l'Universitat Jaume I. L'intégration de modèles VLA (vision-language-action) pour la compréhension contextuelle des tâches et la certification ATEX pour les robots industriels constituent les prochains jalons pour plusieurs de ces familles.

UEPlusieurs acteurs européens figurent parmi les leaders des niches couvertes, Eelume/NTNU (soutenu par Equinor et Kongsberg) sur la maintenance offshore résidente, l'EPFL sur la soft robotics co-robotique, l'Universitat Jaume I sur l'aquaculture, et le financement croissant via le Blue Deal européen devrait accélérer les déploiements dans ce secteur, créant des opportunités pour les startups françaises Pollen Robotics et Enchanted Tools si elles se positionnent sur ces créneaux applicatifs.

IndustrielActu
1 source
Nvidia mise sur l'IA physique au GTC Taipei : nouveau modèle de monde, cerveau de conduite et robot humanoïde open source
77The Decoder 

Nvidia mise sur l'IA physique au GTC Taipei : nouveau modèle de monde, cerveau de conduite et robot humanoïde open source

Lors du GTC Taipei, Nvidia a dévoilé plusieurs modèles destinés à accélérer son offensive dans l'IA physique. La conférence a été marquée par trois annonces majeures : Cosmos 3, un nouveau modèle de monde (world model) de dernière génération, Alpamayo 2 Super, une version considérablement élargie du modèle de conduite autonome, et une plateforme de référence ouverte pour robots humanoïdes. Ces annonces s'inscrivent dans la stratégie de Jensen Huang de faire de Nvidia le fournisseur incontournable de l'infrastructure pour les systèmes physiques intelligents. Ces outils visent des marchés en pleine explosion : la robotique industrielle, les véhicules autonomes et les systèmes de surveillance vidéo intelligents. Un world model comme Cosmos 3 permet à des robots ou des voitures autonomes de simuler leur environnement et d'anticiper les conséquences de leurs actions, une brique fondamentale pour passer de la démonstration laboratoire au déploiement à grande échelle. La plateforme humanoïde ouverte, quant à elle, vise à standardiser le développement matériel et logiciel pour les constructeurs de robots à deux jambes, réduisant les coûts d'entrée pour les startups du secteur. Nvidia capitalise ici sur sa domination dans les GPU d'entraînement pour étendre son empreinte vers l'inférence embarquée et les systèmes temps-réel. La concurrence s'intensifie avec des acteurs comme Qualcomm et Intel sur les puces pour véhicules autonomes, tandis que des entreprises comme Figure, Boston Dynamics ou 1X Technologies attendent des plateformes logicielles communes pour accélérer leurs développements. GTC Taipei confirme que Nvidia ne veut pas seulement alimenter les data centers de l'IA, il veut aussi être le cerveau des machines qui bougent.

UELes constructeurs automobiles européens (Renault, Stellantis, BMW, Volkswagen) et les startups robotiques européennes pourraient bénéficier de la plateforme humanoïde ouverte pour réduire leurs coûts d'entrée et accélérer leurs développements en robotique industrielle et véhicules autonomes.

HumanoïdesOpinion
1 source
SSR : locomotion humanoïde stable et symétrique étendue au monde ouvert
78arXiv cs.RO 

SSR : locomotion humanoïde stable et symétrique étendue au monde ouvert

Des chercheurs ont publié fin mai 2026 sur arXiv (preprint 2605.30770) un framework baptisé SSR, pour "Surefooted and Symmetric Robotics", destiné à la locomotion en environnement ouvert pour robots humanoïdes. L'approche est entièrement end-to-end et s'appuie sur la vision égocentrique (caméra embarquée sur le robot) pour guider le placement des pieds en temps réel sur des terrains hétérogènes. Le système a été validé expérimentalement sur escaliers à géométrie variable, plateformes surélevées, passages à larges écarts et parcours outdoor longue distance, des scénarios qui constituent précisément les points de rupture des pipelines classiques de locomotion bipedale. Aucune entreprise commerciale n'est mentionnée : il s'agit d'un travail académique, à ce stade sans déploiement industriel annoncé. SSR apporte trois contributions techniques distinctes. La première, "imagined foothold guidance", consiste à modéliser par anticipation les contacts futurs du pied en phase d'oscillation (swing phase) avant l'atterrissage, orientant le mouvement vers des zones de support stables et réduisant les glissades en bordure d'obstacle, un problème récurrent sur les robots qui réagissent uniquement au contact. La deuxième, une augmentation de symétrie dans l'espace latent par équivariance, force une coordination bilatérale cohérente (gauche-droite) même sous des observations visuelles haute dimension, ce que les méthodes classiques de data augmentation peinent à garantir. La troisième, des discriminateurs de mouvement spécialisés par type de terrain, pousse le robot vers des comportements anthropomorphes contextualisés plutôt qu'une démarche générique. Ces trois mécanismes adressent directement le "demo-to-reality gap" : la locomotion reste stable sans nécessiter de détection terrain explicite ni de carte métrique préétablie. Le problème de traversée en vision égocentrique pour humanoïdes a été abordé ces dernières années par plusieurs axes : les approches model-based (Boston Dynamics Atlas, avec planification explicite), les méthodes RL aveugles (Unitree H1, Agility Robotics Digit), et plus récemment les VLA (Vision-Language-Action) comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, qui cherchent à généraliser via des fondations préentraînées. SSR se positionne dans une voie intermédiaire, apprentissage de bout en bout sans modèle de terrain, mais sans large fondation multimodale. L'absence de chiffres de cycle time, de payload ou de taux de succès quantifiés dans l'abstract invite à la prudence avant d'évaluer la portée réelle ; les résultats complets sont dans le papier. Les prochaines étapes naturelles seraient un benchmark comparatif standardisé (type parkour DARPA ou ANYmal) et un pilote sur plateforme commerciale existante.

HumanoïdesPaper
1 source
Unitree dépose un dossier d'introduction en Bourse pour devenir la première action d'IA incarnée
79Pandaily 

Unitree dépose un dossier d'introduction en Bourse pour devenir la première action d'IA incarnée

Unitree Robotics, fabricant chinois de robots généraux haute performance, a soumis le 1er juin 2026 son dossier d'introduction en bourse au comité d'admission de la Bourse de Shanghai pour examen. L'entreprise vise à devenir la "première action d'intelligence incarnée" cotée sur le marché A-share chinois, plus précisément sur le STAR Market, la section dédiée aux entreprises de haute technologie. Selon son prospectus, le chiffre d'affaires de Unitree est passé de 159 millions de yuans en 2023 à 1,699 milliard de yuans en 2025, soit un taux de croissance annuel composé de 226,78 %. Sur la même période, le résultat net (hors éléments exceptionnels) a basculé d'une perte de 18 millions à un bénéfice de 591 millions de yuans. Au premier trimestre 2026, la dynamique se complique : le chiffre d'affaires progresse encore de 68,49 % en glissement annuel, mais le bénéfice net chute de 52,55 %, sous l'effet d'une hausse de 38,3 millions de yuans des dépenses de R&D et d'une augmentation sensible des coûts commerciaux. L'entreprise revendique par ailleurs le titre de premier expéditeur mondial de robots humanoïdes en 2025, avec une présence déployée du plateau du Gala du Nouvel An chinois à l'aéroport de Haneda à Tokyo. Cette introduction en bourse marque une inflexion structurelle pour le secteur robotique chinois : le marché passe d'une phase "thématique", portée par les annonces et les narratifs, à une phase de "valorisation autonome", où les fondamentaux opérationnels prennent le dessus. Pour les intégrateurs et les décideurs industriels, la trajectoire financière de Unitree (rentabilité atteinte en deux ans, malgré une compression récente des marges liée à la R&D) confirme que certains acteurs du segment humanoïde ont franchi le cap de la viabilité économique. La baisse du bénéfice net au T1 2026 mérite toutefois d'être contextualisée : elle reflète un choix délibéré d'investissement intensif, pas un retournement de tendance, ce que les observateurs du STAR Market tendent à interpréter positivement, à condition que les dépenses restent concentrées sur les technologies cœur. La levée de fonds permettra d'accélérer la R&D et d'augmenter les capacités de production, avec des effets d'entraînement attendus sur toute la chaîne d'approvisionnement : capteurs, servosystèmes, algorithmes embarqués. Fondée à Hangzhou, Unitree s'est d'abord imposée avec ses robots quadrupèdes (gamme Go et B), avant d'élargir son catalogue aux robots semi-humanoïdes à double bras et aux humanoïdes bipèdes comme le H1 et le G1. La société évolue dans un environnement concurrentiel dense : Boston Dynamics (Hyundai), Figure AI, Agility Robotics (Amazon) et Tesla Optimus sur le segment international ; Fourier Intelligence, Leju Robotics et Agibot sur le marché domestique chinois. L'IPO s'inscrit dans un contexte de soutien politique explicite de Pékin à la filière robotique, identifiée comme priorité stratégique. Les prochaines étapes observables incluront l'allocation des fonds levés entre expansion capacitaire et R&D, ainsi que l'évolution des déploiements commerciaux au-delà des applications de démonstration, critère clé pour juger si Unitree bascule réellement du statut de "robot maker" à celui d'acteur d'infrastructure industrielle.

UEL'IPO renforce la capacité de Unitree à accélérer sa R&D et ses volumes de production, intensifiant la pression concurrentielle chinoise sur les fabricants européens de robots industriels et humanoïdes.

Chine/AsieOpinion
1 source
Robot bipède DIY : des muscles pneumatiques à la place des moteurs
80IEEE Spectrum Robotics 

Robot bipède DIY : des muscles pneumatiques à la place des moteurs

En 1987, Richard Greenhill, photographe britannique autodidacte passionné de robotique, lance dans son grenier londonien un projet qui n'intéresse personne chez son employeur de l'époque, la startup Intergalactic Robots : construire un humanoïde bipède de taille réelle. Il réunit chaque mercredi soir une douzaine d'enthousiastes, baptisés le Shadow Group, qui assemblent des composants récupérés dans des imprimantes et des déchetteries. Leur machine principale, le Shadow Walker, repose sur un squelette en bois d'érable inspiré des atlas médicaux d'anatomie humaine, dessiné par David Buckley, spécialiste de la robotique et de l'animatronique. Plutôt que des moteurs électriques, Greenhill opte pour 28 muscles pneumatiques, une variante des muscles de McKibben inventés dans les années 1950, qui se contractent ou s'étendent sous air comprimé. Ces actionneurs sont répartis sur huit articulations (hanches, genoux, chevilles, orteils), offrant 12 degrés de liberté. Le robot mesure 168 cm, pèse 38 kg et intègre dans son torse les électrovannes, l'électronique et les interfaces informatiques. L'équipe parvient à lui faire tenir debout et à maintenir son équilibre, y compris après de légères poussées. La marche, en revanche, reste hors de portée. Ce projet illustre un paradoxe structurant des débuts de la robotique humanoïde : la station debout et l'équilibre statique sont des problèmes résolubles avec des moyens modestes, mais la locomotion dynamique exige une fiabilité de capteurs et d'actionneurs que les composants de récupération ne peuvent garantir. Rich Walker, recruté adolescent dans le groupe, tente d'utiliser des réseaux de neurones pour résoudre le problème de l'équilibre, une approche qui anticipe d'une trentaine d'années les architectures d'apprentissage par renforcement aujourd'hui au coeur des locomotion controllers de Boston Dynamics ou Agility Robotics. Les obstacles rencontrés, notamment la défaillance fréquente des valves pneumatiques et la fragilité générale du châssis, documentent en creux pourquoi les muscles artificiels pneumatiques ont largement cédé la place aux actionneurs électriques dans les humanoïdes commerciaux contemporains. Le Shadow Walker émerge dans un contexte d'effervescence institutionnelle : 1987 voit simultanément la création de l'IEEE Robotics and Automation Society et de l'International Federation of Robotics. Sur le plan industriel, Honda travaille depuis 1986 sur ses robots expérimentaux de la série E, dont les travaux conduiront au P2 (1996, 183 cm, 210 kg, premier humanoïde à marche autonome stable) puis à ASIMO. L'approche pneumatique du Shadow Group, documentée par Rich Walker dans une note technique publiée en 1999 sur le site de David Buckley, reste une référence de niche pour les chercheurs explorant les actionneurs bio-inspirés à compliance variable, un domaine qui connaît un regain d'intérêt dans les laboratoires travaillant sur la sécurité humain-robot en manipulation industrielle.

RecherchePaper
1 source
PhAIL : un benchmark VLA sur robots réels et une méthodologie distributionnelle
81arXiv cs.RO 

PhAIL : un benchmark VLA sur robots réels et une méthodologie distributionnelle

PhAIL (Physical AI Leaderboard, phail.ai) est un benchmark open-source présenté sur arXiv (arXiv:2605.29710) qui évalue des politiques VLA (vision-language-action) sur un bras Franka FR3 en conditions réelles. Le protocole remplace le traditionnel taux de succès binaire à timeout fixe par une méthodologie distributionnelle centrée sur la fonction de distribution cumulative du temps-avant-succès (CDF). Deux outils distincts structurent l'évaluation : un score nommé Human-Relative Throughput (HRT), grandeur sans dimension avec intervalles de confiance bootstrap, ancré à la téléopération humaine sur le même équipement ; et un test de significativité Kolmogorov-Smirnov calculé par objet puis macro-moyenné. Le benchmark a été appliqué à quatre VLAs publiques, dont GR00T (NVIDIA), ACT et OpenPI, avec jusqu'à 30 rollouts par cellule (modèle x objet). Résultat central : le meilleur VLA évalué reste environ sept fois plus lent par opération que la référence humaine, mesuré via le ratio RMST. L'enjeu est méthodologique autant que technique. L'état de l'art en évaluation VLA repose presque universellement sur un taux de succès à timeout fixe avec N inférieur ou égal à 25 rollouts et sans intervalles de confiance, ce qui rend les comparaisons proches statistiquement non résolvables. PhAIL démontre que le test KS macro-moyenné tranche deux paires proches (GR00T vs. ACT, OpenPI vs. ACT) là où les métriques binaires échouent, toujours à N inférieur ou égal à 30 rollouts. La paire la plus serrée, OpenPI vs. GR00T, reste irrésolue dans le budget expérimental alloué. Le facteur sept entre humain et meilleur VLA constitue un point d'ancrage concret pour les intégrateurs et décideurs industriels qui doivent arbitrer entre performance annoncée et réalité opérationnelle. La publication s'inscrit dans un effort de standardisation comparable à ce qu'ImageNet ou GLUE ont accompli pour la vision par ordinateur et le traitement du langage naturel. Le champ VLA manquait d'un protocole reproductible et statistiquement rigoureux, rendant les comparaisons entre Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA), OpenPI ou les architectures propriétaires de Figure et Boston Dynamics difficiles à interpréter. Le Franka FR3, très répandu en recherche académique, sert de plateforme de référence, et le benchmark est entièrement ouvert : dataset, artefacts par rollout et implémentation de bout en bout disponibles sur phail.ai. Les prochaines étapes naturelles incluent l'extension à d'autres plateformes matérielles, à des tâches bimanuelles ou de manipulation complexe, et l'intégration de VLAs propriétaires dans le protocole.

UELe benchmark PhAIL repose sur le bras Franka FR3 très répandu dans les laboratoires académiques européens, offrant aux chercheurs et intégrateurs UE un protocole rigoureux et reproductible pour évaluer les VLAs en conditions réelles et quantifier objectivement l'écart entre performance annoncée et réalité opérationnelle.

💬 Ce que je retiens, c'est le facteur 7. Le meilleur VLA testé reste sept fois plus lent qu'un humain sur la même tâche, et c'est la première fois qu'on a une mesure comme ça, proprement ancrée sur de la téléopération humaine réelle avec du KS test et des intervalles de confiance. Le benchmark binaire à timeout qu'on utilisait jusque-là, c'était du bricolage habillé en science.

IA physiqueOpinion
1 source
XPeng présente sa gamme complète d'IA physique au salon automobile GBA 2026
82Pandaily 

XPeng présente sa gamme complète d'IA physique au salon automobile GBA 2026

XPeng a présenté l'intégralité de sa gamme "physical AI" au salon automobile 2026 de la Grande Baie (Guangdong-Hong Kong-Macao Greater Bay Area Auto Show), organisé fin mai à Guangzhou. La démonstration centrale porte sur le système de conduite autonome end-to-end basé sur un réseau de neurones, que XPeng déploie en navigation assistée à l'échelle urbaine depuis plusieurs trimestres. L'entreprise expose également ses travaux en robotique humanoïde et en IA incarnée, articulés autour de trois briques techniques : perception, prise de décision et actuation. L'article source ne précise aucun nom de modèle robot, aucune métrique de charge utile ou de degré de liberté, ni aucun chiffre de déploiement, ce qui signale davantage un teaser de positionnement qu'un lancement produit documenté. Ce salon illustre une tendance structurelle dans l'industrie automobile chinoise : les constructeurs EV se requalifient en sociétés d'IA, avec des piles technologiques qui couvrent désormais la mobilité autonome, la robotique industrielle et l'IA embarquée. Pour les intégrateurs et décideurs B2B, ce mouvement signifie que les acteurs automobiles deviennent des concurrents directs des fournisseurs de robotique traditionnels. La convergence entre châssis, capteurs, compute embarqué et modèles de fondation réduit les barrières à l'entrée pour les déploiements humanoïdes en environnement industriel. Cela dit, l'absence de métriques concrètes dans la communication de XPeng interdit toute comparaison rigoureuse avec Figure (Figure 03), Boston Dynamics (Atlas), ou les plateformes chinoises comme Unitree ou Agibot. XPeng a été l'un des premiers constructeurs chinois à déployer la navigation assistée en ville à grande échelle, ce qui lui confère une base de données réelle conséquente pour entraîner ses modèles. La Baie de Canton concentre une part significative de l'écosystème EV-AI mondial, avec Shenzhen et Guangzhou comme noyaux de R&D et de chaîne d'approvisionnement. La concurrence directe inclut BYD, NIO, Li Auto et Xiaomi, tous engagés dans des investissements massifs en conduite autonome et en IA. La prochaine étape observable pour XPeng sera la publication de benchmarks concrets sur ses robots ou l'annonce de pilotes industriels chiffrés, seuls jalons permettant d'évaluer la portée réelle de cette stratégie "physical AI".

Chine/AsieOpinion
1 source
Entreprise chinoise dévoile un robot humanoïde compact avec 42 degrés de liberté et 100 TOPS de puissance de calcul
83Interesting Engineering 

Entreprise chinoise dévoile un robot humanoïde compact avec 42 degrés de liberté et 100 TOPS de puissance de calcul

KEENON Robotics, entreprise shanghaïenne spécialisée dans les robots de service autonomes, a officiellement lancé le XMAN-L1, un robot humanoïde compact destiné aux environnements d'accueil et d'interaction commerciale. Mesurant 136 cm pour un gabarit délibérément contenu, l'XMAN-L1 embarque 42 degrés de liberté biomimétiques, un couple de genou de 132 Nm, une puissance supérieure à 2 000 W par jambe, et une capacité de calcul embarqué de 100 TOPS en inférence locale. Pour la couche conversationnelle, KEENON a intégré les LLMs de Doubao (ByteDance) et de Tencent, permettant un dialogue en langage naturel sans connexion cloud obligatoire. La société annonce le robot comme commercialement disponible immédiatement, avec des cas d'usage ciblés : réception de visiteurs, guidage, animation interactive et présence en espace public. Aucun prix public n'a été communiqué à ce stade. Ce lancement illustre une tendance de fond dans l'industrie robotique chinoise : intégrer des spécifications techniques auparavant réservées aux plateformes de recherche dans des formats de service compacts et déployables à grande échelle. Les 100 TOPS de computing edge sont un signal clair -- le robot est conçu pour fonctionner de manière autonome dans des environnements bruités sans dépendre d'une infrastructure cloud latente, ce qui est un prérequis réel pour l'hôtellerie et le retail. L'intégration native de deux LLMs chinois (Doubao et Tencent) plutôt qu'une API générique constitue un choix de souveraineté technologique cohérent avec le marché domestique visé. Il faut cependant noter que les métriques de mobilité annoncées -- couple et puissance -- ne sont pas accompagnées de données de cycle ou de tests en charge réelle, une réserve habituelle sur ce type d'annonce de lancement. KEENON est historiquement l'un des leaders mondiaux du robot de livraison indoor, avec des gammes bien établies : DINERBOT pour la restauration, BUTLERBOT pour l'hôtellerie, et la série T pour la logistique industrielle. L'XMAN-L1 s'inscrit dans sa série humanoïde XMAN, aux côtés de l'XMAN-R1 (recherche et collaboration homme-robot) et de l'XMAN-F1 (déploiement commercial en réception). Sur le marché humanoïde de service à format compact, KEENON se positionne face à des acteurs comme Enchanted Tools (France, robot Miroki), Unitree (H1/G1) ou encore Fourier Intelligence, tous engagés sur des niches similaires. Les plateformes à vocation industrielle lourde -- Figure 03, Optimus Gen 3, Atlas -- ne ciblent pas encore ce segment. Pour les intégrateurs B2B en hôtellerie ou retail, l'XMAN-L1 représente une option à surveiller, à condition que KEENON publie des données de fiabilité terrain dans les prochains mois de déploiement.

UELe lancement du XMAN-L1 renforce la pression concurrentielle sur Enchanted Tools (France, robot Miroki) dans le segment des humanoïdes de service compact pour l'hôtellerie et le retail.

Chine/AsieOpinion
1 source
Les VLA échouent différemment selon leur architecture : ce que révèle la surveillance en boîte noire
84arXiv cs.RO 

Les VLA échouent différemment selon leur architecture : ce que révèle la surveillance en boîte noire

Une étude publiée sur arXiv en mai 2026 (réf. 2605.28726) remet en question une hypothèse largement répandue dans le déploiement des politiques robotiques VLA : le contrôle de vitesse constituerait un indicateur fiable de défaillance motrice. Les chercheurs ont soumis trois architectures VLA majeures, VQ-BeT (tokens discrets), Diffusion Policy et ACT (architectures continues), à un protocole unifié de 450 épisodes sur deux plateformes : PushT et ALOHA, ce dernier couvrant la manipulation bimane à 14 degrés de liberté. Premier résultat : le taux d'inversion de direction est le seul prédicteur universel de défaillance, avec des AUROC de 0,93, 0,79 et 0,91 selon l'architecture (p < 0,001). Le monitoring des à-coups (jerk) se révèle prédictif uniquement pour les architectures à tokens discrets, avec un gradient décroissant de 0,88 à 0,41 en passant aux architectures continues. Le contrôle de vitesse, lui, affiche des AUROC entre 0,41 et 0,52 sur les architectures continues, soit un niveau proche du hasard. Ces résultats ont une portée directe pour les équipes de déploiement : le contrôle de vitesse est actuellement le mécanisme de sécurité le plus répandu dans les bases de code VLA en production, et il s'avère inefficace pour détecter une défaillance imminente sur les architectures continues (AUROC 0,52 sur ACT, 0,41 sur Diffusion Policy). L'étude établit que les familles discrètes et continues produisent des signatures de défaillance qualitativement différentes, et qu'aucun moniteur unique ne peut couvrir les deux. Pour un intégrateur ou un COO déployant un humanoïde ou un bras collaboratif en cellule de production, un indicateur de sécurité mal calibré représente un risque opérationnel concret, pas une nuance académique. La distinction discret/continu dans les VLA est connue depuis les travaux fondateurs sur ACT (Zhao et al., 2023) et Diffusion Policy (Chi et al., 2023), mais ses implications sur le monitoring n'avaient pas été quantifiées à cette échelle. L'étude repose sur SafeContract, un toolkit open source de surveillance en boîte noire sans réentraînement, avec calibration conforme, accessible sur GitHub (krishnam94/vla-edge). Les acteurs déployant aujourd'hui des architectures continues, notamment Figure AI avec Figure 03, Physical Intelligence avec son modèle π0, ou Boston Dynamics, sont directement concernés par ces résultats. La prochaine étape logique est l'intégration de moniteurs architecture-spécifiques dans les pipelines de validation sim-to-real, en amont de toute mise en production sur site.

UELes intégrateurs et équipes R&D européens déployant des architectures VLA continues (ACT, Diffusion Policy) doivent auditer leurs mécanismes de surveillance de sécurité, le contrôle de vitesse, mécanisme dominant en production, s'avérant quasi-aléatoire pour détecter les défaillances sur ces architectures.

💬 Le contrôle de vitesse comme indicateur de sécurité sur les VLA continus, c'est à peu près aussi fiable que tirer à pile ou face. Ce n'est pas une petite subtilité académique : c'est le mécanisme le plus déployé en production aujourd'hui, et il détecte les défaillances imminentes avec un AUROC de 0,41 sur Diffusion Policy. Reste à voir combien d'intégrateurs vont vraiment auditer leurs pipelines après ça, mais l'étude arrive au bon moment, avec un toolkit open source en bonus.

IA physiqueOpinion
1 source
Estimation de traversabilité auto-supervisée et agnostique au robot pour des environnements ouverts
85arXiv cs.RO 

Estimation de traversabilité auto-supervisée et agnostique au robot pour des environnements ouverts

Une équipe de chercheurs présente COTRATE (Continuous Online TRAversability EsTimation), un framework d'apprentissage en ligne pour l'estimation de traversabilité des terrains par des robots mobiles, publié sur arXiv en mai 2026 (arXiv:2605.28442). Le système apprend de façon auto-supervisée à partir de données non étiquetées collectées par le robot en temps réel. COTRATE fonctionne en deux étapes : un module d'évaluation du terrain exploitant les signaux proprioceptifs et inertiels génère des scores de traversabilité robustes, qui supervisent ensuite un réseau de traversabilité visuelle via une fonction de perte par alignement (alignment loss). Pour limiter l'oubli catastrophique propre à l'apprentissage continu, les auteurs proposent une stratégie de sélection de features basée sur la diversité, s'appuyant sur une mémoire de relecture compacte. Le système a été évalué sur un dataset d'environ 50 000 images collectées avec deux plateformes robotiques sur 11 types de terrains extérieurs, et benchmarké sur des tâches de navigation dans trois environnements extérieurs représentatifs. Le code, le dataset et les modèles pré-entraînés sont disponibles publiquement. La traversabilité est un problème central pour les robots mobiles opérant en environnement non structuré : savoir si un sol est praticable, à quelle vitesse et avec quel risque de chute ou de blocage conditionne directement la sécurité et l'efficacité des missions. Les approches existantes butaient sur un double écueil : soit elles reposaient sur des scores proprioceptifs artisanaux, spécifiques à une plateforme et donc non transférables, soit elles pré-calculaient des clusters sur des données antérieures sans possibilité d'adaptation en ligne. COTRATE lève les deux limitations simultanément : il est robot-agnostic, avec un transfert de connaissances démontré entre plateformes à cinématiques différentes, et il apprend en continu sans coût mémoire ou calcul prohibitif, rendant le déploiement embarqué crédible. C'est un signal pertinent pour les intégrateurs de robots extérieurs dans l'agriculture, l'inspection d'infrastructure ou la défense, secteurs où les conditions terrain varient et où annoter des données à la main reste hors de portée à l'échelle. L'estimation de traversabilité auto-supervisée est un champ actif depuis plusieurs années, porté notamment par des laboratoires travaillant sur les robots quadrupèdes comme ANYmal (ANYbotics) ou Spot (Boston Dynamics) ainsi que sur les UGV de type Clearpath Robotics. Les méthodes antérieures les plus citées dans ce domaine, dont certaines issues d'ETH Zurich ou de CMU, reposaient généralement sur des données pré-collectées ou des heuristiques proprioceptives figées. COTRATE se positionne comme une solution plus générale, bien que la publication soit à ce stade un preprint arXiv sans validation en peer review et qu'aucun partenaire industriel ni déploiement terrain en production ne soit mentionné. Les étapes naturelles seraient une validation sur des plateformes commerciales en conditions réelles prolongées et une intégration dans des stacks de navigation open-source comme Nav2 ou le framework Elevation Mapping de la communauté ETH.

UEImpact indirect via la communauté de recherche européenne (ETH Zurich cité comme référence clé) et pertinence pour les intégrateurs EU en agriculture et inspection d'infrastructure, mais aucun acteur français ni déploiement européen mentionné.

RecherchePaper
1 source
HumanoidMimicGen : génération de données pour la loco-manipulation par planification corps entier
86arXiv cs.RO 

HumanoidMimicGen : génération de données pour la loco-manipulation par planification corps entier

Des chercheurs ont présenté HumanoidMimicGen (arXiv:2605.27724), une méthode de génération automatique de données d'apprentissage par imitation pour robots humanoïdes devant à la fois marcher et manipuler des objets. Le problème central: la téléopération pour collecter ces démonstrations est lente et coûteuse, particulièrement difficile pour des humanoïdes dont l'espace d'action composite intègre bras, jambes et torse simultanément. Le système adapte des compétences corps entier riches en contacts à partir d'un petit nombre de démonstrations sources vers de nouveaux états et configurations d'objets, en combinant planification de la locomotion et de la manipulation à un ou deux bras. Un benchmark de simulation en 9 tâches de loco-manipulation valide l'approche: les politiques visuomotrices co-entraînées avec les données générées surpassent de 20% celles entraînées uniquement sur des données réelles. La rareté des données d'entraînement reste le principal verrou au déploiement des humanoïdes en contexte industriel. Les méthodes existantes de génération de données, conçues pour bras fixes, échouent sur les humanoïdes en raison de la coordination complexe entre locomotion et manipulation dans un espace d'état de haute dimension. HumanoidMimicGen apporte un argument concret: multiplier automatiquement les démonstrations à partir de quelques exemples et gagner 20% sur les politiques apprises conteste directement l'hypothèse que les humanoïdes nécessitent obligatoirement des milliers d'heures de téléopération. Pour les décideurs industriels et les intégrateurs, c'est un signal que le goulot des données pourrait être levé par simulation, compressant potentiellement les cycles de développement. HumanoidMimicGen prolonge directement MimicGen, publié en 2023 pour des bras manipulateurs à base fixe. L'extension aux humanoïdes répond à la pression commerciale entre Figure (modèles 01, 02), Agility Robotics (Digit), 1X, Unitree (G1, H1) et Boston Dynamics (Atlas), tous en quête de méthodes d'apprentissage scalables sans exploser les budgets de téléopération. Du côté recherche, Physical Intelligence (pi0) et NVIDIA (GR00T N2) travaillent également sur des politiques visuomotrices corps entier généralisables. Ce travail demeure un résultat académique pré-publication sur arXiv, sans déploiement industriel annoncé et avec des expériences exclusivement en simulation. La robustesse du transfert sim-to-real, non abordée dans ce papier, constituera l'étape critique avant tout passage en conditions réelles.

RecherchePaper
1 source
Locomotion naturelle : principe et méthode
87arXiv cs.RO 

Locomotion naturelle : principe et méthode

Un préprint déposé sur arXiv (identifiant 2605.28254) propose un cadre théorique formalisé pour ce que les auteurs appellent la "locomotion naturelle", une famille de mouvements robotiques fondée non pas sur le suivi de trajectoires prescrites, mais sur l'exploitation des dynamiques passives, de la compliance mécanique et des phénomènes de résonance. Le cœur du papier est un principe d'échange : un mouvement est dit "naturel" lorsqu'un oscillateur interne revient périodiquement, que la pose globale du corps dérive de façon nette, et que la puissance moyenne d'échange propulsion-oscillateur (POE power) est nulle sur un cycle complet. L'ensemble des cycles satisfaisant ces conditions forme ce que les auteurs appellent une Natural Locomotion Manifold (NLM). La méthode repose sur une construction fermée puis ouverte : le canal propulsif est d'abord isolé pour révéler un oscillateur effectif interne, structuré par une action-angle scalaire ou par des secteurs modaux non linéaires à plusieurs degrés de liberté, avant d'être rouvert pour reconstruire la pose et vérifier la cohérence du cycle. La démonstration s'appuie sur deux systèmes non holonomes sans glissement : le "Chaplygin-sleigh" avec pendule moteur et une extension à trois corps. Ce travail répond à une question de conception plutôt qu'à un problème de contrôle : quelles architectures passives permettent l'existence de familles NLM certifiées, et combien ? C'est un renversement de perspective par rapport à la robotique locomotrice dominante, où le contrôle actif compense en permanence les imperfections du modèle. Une locomotion ancrée dans les dynamiques passives implique une consommation énergétique structurellement moindre, non par optimisation du contrôleur, mais par design mécanique. Pour les équipes travaillant sur des robots marcheurs ou nageurs à batterie embarquée, ce type de cadre formel peut guider le choix d'architectures mécaniques avant même d'écrire une ligne de code de contrôle. Le domaine de la locomotion passive a pour ancêtre les travaux de Tad McGeer (1990) sur les marcheurs passifs en descente, prolongés par les laboratoires de Cornell, MIT et Delft dans les années 2000. Depuis, la plupart des robots humanoïdes commerciaux, Boston Dynamics Atlas, Figure 03, Unitree H1, ont opté pour un contrôle actif intensif, au prix d'une consommation électrique élevée. Ce préprint, purement théorique et sans validation expérimentale annoncée, ne propose pas encore de robot ni de plateforme de test ; il fournit un outil mathématique. La prochaine étape naturelle serait une validation sur un prototype physique ou en simulation, et une extension à des architectures de robots à pattes à plus de deux degrés de liberté effectifs.

RecherchePaper
1 source
Le robot humanoïde XPeng IRON entre en production en série accélérée, attendu en showroom en 2027
88Pandaily 

Le robot humanoïde XPeng IRON entre en production en série accélérée, attendu en showroom en 2027

Le constructeur automobile chinois XPeng a officiellement lancé la phase de sprint vers la production de masse de son robot humanoïde IRON, avec un objectif de production en série d'ici fin 2026 et un déploiement commercial dès le premier trimestre 2027. Selon des sources sectorielles, IRON sera d'abord déployé dans les propres showrooms de XPeng, où il assurera des missions d'accueil, d'accompagnement client et de présentation des véhicules. La plateforme mesure moins de 1,70 mètre et embarque trois puces IA Turing, le système de vision XNGP AI Hawk Eye déjà utilisé dans les voitures XPeng, et un réseau de radars 4D à ondes millimétriques pour la perception temps réel de l'environnement. La capacité de production visée est de l'ordre de plusieurs milliers d'unités par mois, ce qui placerait IRON parmi les premiers robots humanoïdes chinois à atteindre un volume industriellement significatif. Le robot avait été présenté lors d'un événement produit antérieur, où sa démarche naturaliste avait suscité des doutes quant à son authenticité, certains spectateurs soupçonnant un humain déguisé. Le choix de déployer IRON dans des environnements commerciaux contrôlés plutôt qu'en usine ou à domicile est une décision stratégique révélatrice de l'état réel du secteur. He Xiaopeng, PDG de XPeng, l'a lui-même reconnu publiquement : les robots humanoïdes actuels ne sont pas encore capables de répondre aux exigences de précision des lignes de fabrication ni à l'imprévisibilité des environnements domestiques. Cette honnêteté tranche avec le discours marketing dominant dans le secteur. En se limitant à des scénarios à tâches répétables et cadre structuré, XPeng optimise les chances de succès opérationnel tout en utilisant ses propres points de vente comme terrain de collecte de données réelles, une boucle de feedback qui alimentera les itérations suivantes du modèle. Pour les intégrateurs et les décideurs industriels, cela confirme une règle empirique du moment : le "sim-to-real gap" reste le principal frein, et les déploiements réussis passent d'abord par des verticales à faible variabilité. XPeng, connu pour ses véhicules électriques et ses systèmes ADAS avancés, capitalise ici sur sa maîtrise de la perception embarquée pour accélérer le développement robotique. Dans le paysage concurrentiel, IRON se positionne face à des acteurs comme Unitree (G1, H1), Fourier Intelligence ou encore Agibot en Chine, et à l'international contre Figure (Figure 02), Agility Robotics (Digit, déployé chez Amazon) et Boston Dynamics (Atlas). Tesla reste un point de comparaison incontournable avec Optimus, dont la production est également annoncée pour 2025-2026 sans déploiement commercial confirmé à grande échelle. La prochaine étape décisive pour IRON sera la démonstration de fiabilité opérationnelle sur plusieurs mois en condition réelle, seul indicateur qui permettra de distinguer un déploiement commercial effectif d'une vitrine technologique.

HumanoïdesOpinion
1 source
Guide du premier jour du Robotics Summit & Expo 2026
89Robotics Business Review 

Guide du premier jour du Robotics Summit & Expo 2026

Le Robotics Summit & Expo 2026 a ouvert ses portes le 27 mai au Thomas M. Menino Convention & Exhibition Center de Boston, réunissant plus de 5 000 développeurs issus de l'aérospatiale et défense, de la santé, de la logistique et de l'industrie manufacturière. La journée a débuté à 9h00 ET avec deux keynotes consécutives en salle 253 ABC. La première, intitulée "Building the Next Era of Robot Autonomy", a réuni Aaron Parness (directeur des sciences appliquées chez Amazon Robotics), Anders Beck (vice-président produits IA et robotique chez Universal Robots), Hamid Montazeri (SVP software et IA chez Locus Robotics) et John Wall (président de QNX). La seconde, "The State of Humanoids", démarrée à 10h00, a mis en scène Alberto Rodriguez (directeur du comportement robotique pour Atlas chez Boston Dynamics) et Pras Velagapudi (CTO d'Agility), aux côtés de représentants de Schaeffler, RealSense et ASTM International. Le show floor a également ouvert à 10h00, avec MassRobotics animant son Startup Alley, son Form & Function Challenge et son Physical AI Accelerator. L'agenda des sessions de la journée révèle les trois tensions structurantes du secteur en 2026 : le fossé sim-to-real (maxon, session 1h45), la commercialisation post-démo (TITAN Robotics, RedZone Robotics, Symbotic avec Teddy Ort en SVP robotics software), et la constitution de data flywheels pour robots AI-natifs (Agtonomy, Semaphor Surgical, Roboto AI, Cambridge Consultants). Deux sessions méritent l'attention des intégrateurs B2B : "Building Warehouse Robots People Actually Want to Work With" par Anthony Jules, co-fondateur de Robust AI, qui adresse frontalement les problèmes d'adoption terrain, et "The Robot MCP Ecosystem" par Contoro Robotics, qui explore les standards ouverts entre IA et robotique. La présence de Conor Walsh (Harvard SEAS) sur la robotique souple portable signal que le marché médical reste une verticale stratégique distincte des humanoïdes. Le Robotics Summit & Expo est l'un des principaux événements industriels robotiques en Amérique du Nord, historiquement centré sur les applications pratiques plutôt que sur la recherche fondamentale, ce qui explique la dominance des profils commerciaux et d'intégration dans le line-up. Cette édition 2026 reflète un marché en transition : après plusieurs années de démos médiatisées, le discours dominant se déplace vers la scalabilité, la fiabilité opérationnelle et la rentabilité. Boston Dynamics (Atlas), Agility (Digit) et Locus Robotics représentent trois approches distinctes de la commercialisation humanoïde et AMR, et leur coprésence sur scène illustre l'absence de standard dominant à ce stade. Les sessions de l'après-midi, plus techniques, s'adressent aux équipes d'ingénierie qui doivent livrer des systèmes en production dans les 12 à 24 prochains mois.

UELa présence de Universal Robots (danois, leader EU du cobot) en keynote principale confirme la compétitivité européenne, mais l'événement se tient à Boston sans déploiement ni initiative directement applicable au marché français ou européen.

HumanoïdesOpinion
1 source
IntBot et Certis Group s'associent pour déployer l'IA physique en entreprise à Singapour
90Robotics Business Review 

IntBot et Certis Group s'associent pour déployer l'IA physique en entreprise à Singapour

IntBot, startup californienne fondée à San Jose, et Certis, opérateur de sécurité et de services aux entreprises coté à la Bourse de Singapour, ont annoncé en mai 2026 un partenariat stratégique visant à développer des applications robotiques dites "socialement intelligentes" pour des environnements à forte affluence publique à Singapour. L'accord prévoit d'intégrer la technologie General Social Intelligence d'IntBot, un système de perception multimodale en temps réel couplé à une boucle d'interaction fermée, aux capacités opérationnelles de Certis dans la gestion de missions critiques. Les cas d'usage ciblés sont les robots concierges et assistants dans des environnements comme les hôtels, les centres de conférence et les campus. IntBot avait présenté son humanoïde de service Nylo au CES 2026, et affirme être déjà déployé dans le secteur de l'hôtellerie, sans fournir de chiffres précis sur l'échelle de ces déploiements ni de spécifications techniques (charge utile, degrés de liberté, temps de cycle). L'annonce reste à ce stade un accord d'exploration : aucun calendrier de déploiement ni volume contractuel n'est communiqué. Ce partenariat illustre un glissement progressif dans la robotique humanoïde commerciale : la manipulation physique des tâches cède progressivement sa place à l'interaction humaine comme principal verrou technologique. Lei Yang, cofondateur et PDG d'IntBot, l'articule explicitement : selon lui, avec la maturité des modèles multimodaux, le bottleneck décisif pour l'IA incarnée se déplace de la manipulation vers l'interaction sociale. Pour les intégrateurs et les décideurs B2B, l'enjeu est concret : un robot humanoïde en espace public doit interpréter les intentions des usagers, gérer un contexte social dynamique et maintenir une fiabilité opérationnelle compatible avec des environnements en exploitation réelle, sans cage de sécurité. L'approche de Certis, qui conçoit la sécurité, la gestion des installations et des effectifs comme un modèle opérationnel unifié, vise à fournir ce que la plupart des startups robotiques peinent à livrer seules : des workflows structurés et une intégration dans des opérations existantes à contraintes élevées. IntBot s'inscrit dans un champ concurrentiel dense, dominé par des acteurs disposant de ressources bien supérieures : Figure AI avec le Figure 03, Tesla avec l'Optimus Gen 3, Boston Dynamics avec l'Atlas, Physical Intelligence avec Pi-0, et Agility Robotics avec Digit, ainsi que Sanctuary AI et 1X pour le volet interaction sociale. Le choix de Singapour comme marché d'entrée est stratégique : la cité-État dispose d'une infrastructure smart-city avancée et d'un cadre réglementaire favorable à l'expérimentation robotique en milieu public. Certis, ancré institutionnellement en Asie-Pacifique, apporte une crédibilité opérationnelle que les startups ne peuvent pas construire seules. La prochaine étape attendue sera la définition concrète des cas d'usage par Certis avant tout déploiement à l'échelle, une phase qui, dans le secteur, prend historiquement bien plus longtemps que les communiqués de presse ne le laissent entendre.

HumanoïdesOpinion
1 source
Guide complet des événements du Robotics Summit & Expo 2026
91The Robot Report 

Guide complet des événements du Robotics Summit & Expo 2026

Le Robotics Summit & Expo 2026 ouvre ses portes le 27 mai à Boston, au Thomas M. Menino Convention & Exhibition Center. L'événement réunit plus de 5 000 experts de la robotique et 200 exposants sur deux jours, avec plus de 50 sessions réparties en cinq tracks : intelligence artificielle, design et développement, technologies habilitantes, santé et logistique. Plus de 70 intervenants représentent des acteurs comme Amazon Robotics, Universal Robots, Locus Robotics, Boston Dynamics, Agility, Tesla, le Toyota Research Institute, Harmonic Drive, maxon, PickNik Robotics et Intrinsic. La première journée s'ouvre à 9h par le panel "Building the Next Era of Robot Autonomy", avec Aaron Parness (directeur de la science appliquée chez Amazon Robotics), Anders Beck (VP produits AI robotics chez Universal Robots), Hamid Montazeri (SVP software et IA chez Locus Robotics) et John Wall (président de QNX). À 10h suivra le panel "The State of Humanoids", incluant Alberto Rodriguez (directeur du comportement robot pour Atlas chez Boston Dynamics) et Pras Velagapudi (CTO d'Agility Robotics). Le 28 mai, Brian Gerkey (board chair d'Open Robotics et CTO d'Intrinsic) livrera la keynote "An Open Foundation for the Age of AI-Powered Robots", et la conférence se clôturera par le témoignage de Noland Arbaugh, premier utilisateur d'un implant cérébral Neuralink. La concentration de sessions de haut niveau sur l'autonomie et les humanoïdes reflète le basculement du secteur d'une phase de démonstration vers une phase de commercialisation active. La présence d'Alberto Rodriguez (Boston Dynamics) et de Pras Velagapudi (Agility) sur le même panel humanoïde est révélatrice : ces deux entreprises sont actuellement les seules à pouvoir revendiquer des déploiements clients documentés à échelle industrielle, et leur coprésence sur scène illustre une compétition directe pour les contrats pilotes. Le thème porté par Gerkey (Intrinsic, filiale Alphabet) sur les fondations logicielles ouvertes pour robots IA pointe une tension structurelle du secteur : la fragmentation des stacks ROS freine l'interopérabilité, et plusieurs acteurs cherchent à imposer un middleware de référence avant que le marché ne se verrouille autour d'un standard propriétaire. Le Robotics Summit est organisé par The Robot Report et Peerless Media, et constitue l'un des deux grands rendez-vous professionnels de la robotique aux États-Unis avec RoboBusiness. L'édition 2026 se tient dans un contexte de forte pression concurrentielle sur le segment humanoïde : Figure AI, 1X, Apptronik, Unitree et Fourier Intelligence ont multiplié les annonces depuis dix-huit mois, tandis que les déploiements réels documentés restent rares. L'absence dans le programme de représentants de Figure AI ou de 1X peut indiquer un positionnement délibéré de ces acteurs en dehors des canaux de conférence traditionnels, ou simplement un agenda non finalisé. Les RBR50 Innovation Awards, remis lors du dîner du soir du 27 mai, constitueront un baromètre utile des projets jugés les plus significatifs par la communauté professionnelle cette année.

LimX Dynamics dévoile Luna, un robot humanoïde qui apprend à danser par IA
92TechNode 

LimX Dynamics dévoile Luna, un robot humanoïde qui apprend à danser par IA

LimX Dynamics a dévoilé lundi son robot humanoïde Luna, commercialisé à 298 000 RMB (environ 41 000 dollars). Mesurant 160 cm de haut, le Luna embarque 27 degrés de liberté répartis sur l'ensemble du corps et s'appuie sur le moteur de contrôle de mouvement SYS 0 de deuxième génération développé en interne. La machine reçoit également une autonomie batterie et un système de refroidissement améliorés par rapport à la génération précédente. Sur le plan logiciel, LimX intègre des capacités d'interaction multimodale et une interface sans code permettant de configurer des déclencheurs de tâches en langage naturel : l'utilisateur décrit son besoin, le robot génère automatiquement les workflows d'exécution correspondants. Les cas d'usage ciblés incluent l'assistance en centre commercial, les expériences de jeu de rôle immersif (personnages NPC humanoïdes) et les interactions en parcs à thème. La fonctionnalité la plus originale est l'apprentissage de chorégraphies par analyse de séquences vidéo : le robot reproduit des mouvements de danse à partir d'un simple clip. Ce positionnement dans le segment entertainment et commercial illustre une tendance de fond : plusieurs constructeurs d'humanoïdes cherchent à rentabiliser leurs plateformes avant d'atteindre la maturité industrielle lourde. À 41 000 dollars, le Luna se place dans une fourchette accessible pour des opérateurs de loisirs ou des intégrateurs retail, bien en dessous des plateformes à vocation industrielle comme l'Optimus de Tesla ou le Figure 03. La promesse du no-code et du langage naturel réduit théoriquement la barrière à l'intégration, un argument clé pour les décideurs B2B sans équipe robotique dédiée. Reste à évaluer la robustesse réelle du SYS 0 en conditions d'exploitation intensive et la fiabilité de l'apprentissage vidéo : la démonstration de danse est visuellement frappante, mais aucun chiffre de performance (précision, taux d'échec, temps d'apprentissage) n'est communiqué. LimX Dynamics est un constructeur chinois spécialisé en locomotion bipède et quadrupède, déjà connu pour ses plateformes de recherche CL-1 et P1. La société s'inscrit dans un écosystème chinois de la robotique humanoïde en pleine accélération, aux côtés d'Unitree (G1, H1), de Fourier Intelligence et d'Agibot. Face à eux, les acteurs occidentaux comme Boston Dynamics (Atlas), Agility Robotics (Digit) ou Physical Intelligence (Pi-0) ciblent davantage la logistique industrielle. LimX choisit une entrée par le marché grand public et l'entertainment, une stratégie qui rappelle celle d'Enchanted Tools en Europe avec son robot Miroki. Les prochaines étapes annoncées concernent des déploiements en centres commerciaux et parcs à thème en Chine, sans calendrier précis ni données de volume communiquées à ce stade.

Chine/AsieOpinion
1 source
Le nouveau robot humanoïde chinois rejoint des agents pour gérer les tâches de voirie
93Interesting Engineering 

Le nouveau robot humanoïde chinois rejoint des agents pour gérer les tâches de voirie

La ville de Shanghai a lancé en mai 2026 le premier programme pilote chinois d'application du droit urbain associant agents municipaux et robot humanoïde dans un espace public. Le déploiement se déroule dans le quartier d'innovation en IA de Zhangjiang, dans l'arrondissement de Pudong, et met en scène le Lingxi X2, robot humanoïde développé par AgiBot, entreprise shanghaïenne fondée en 2023. Le dispositif repose sur une chaîne tripartite : des drones de surveillance identifient en temps réel les infractions commises par des commerçants de rue et transmettent l'information aux agents de patrouille et au Lingxi X2. Le robot se charge ensuite des interactions répétitives à faible valeur décisionnelle, à savoir expliquer les réglementations de voirie, les obligations des exploitants de commerces en façade, et répondre aux questions des marchands. Les agents humains conservent l'intégralité du pouvoir d'évaluation juridique et d'exécution des sanctions. AgiBot décrit la machine comme un "assistant intelligent" et non comme un remplaçant, une précision qui, dans ce contexte politique, est autant un positionnement commercial qu'une garantie opérationnelle. Ce que ce déploiement teste concrètement, c'est la capacité des systèmes d'IA incarnée à tenir un rôle de contact public structuré, avec un corpus de connaissances réglementaires consultable en temps réel, dans un environnement non contrôlé. Pour les intégrateurs et les décideurs en charge de services publics, le cas d'usage est délibérément choisi pour son haut volume de tâches répétitives et son faible risque décisionnel : le robot ne verbalise pas, ne sanctionne pas, n'interprète pas. Il informe. Pan Weijia, responsable de Pudong ayant supervisé l'opération, a explicitement indiqué que l'évaluation portera sur les performances pratiques plutôt que sur le simple volume de déploiement, ce qui signale une approche plus mesurée que le discours habituel sur la scalabilité. Pan Helin, membre du comité d'experts du ministère de l'Industrie et des Technologies de l'Information, a qualifié le pilote de "jalon majeur" dans la commercialisation de l'IA incarnée en administration publique, avec l'objectif affiché de passer des robots capables de "se déplacer" à des robots capables de "travailler efficacement". AgiBot a été fondé en 2023 et s'est positionné rapidement sur le segment des humanoïdes à usage professionnel, avec le Lingxi X2 comme produit phare pour les environnements semi-publics. L'entreprise s'inscrit dans un écosystème chinois d'humanoïdes très dense, qui inclut Unitree (G1, H1), Fourier Intelligence (GR-1), et dans une moindre mesure les ambitions de UBTECH et de Kepler. À l'international, les comparaisons les plus directes sont Figure (01, 02), 1X Technologies (NEO), et Boston Dynamics (Atlas), tous positionnés sur des environnements industriels ou logistiques plutôt que sur l'espace public. Le vrai enjeu du pilote de Pudong n'est pas la performance du robot dans une démonstration maîtrisée, mais sa robustesse sur la durée dans un contexte d'interactions non scénarisées avec des usagers non entraînés. Les prochaines étapes annoncées par Pan Helin visent une extension à d'autres scénarios de service public, sans échéance précisée.

UESignal stratégique indirect pour les décideurs européens de la robotique de service public : la Chine ouvre un précédent réglementaire et opérationnel pour le déploiement d'humanoïdes en espace civil non contrôlé, domaine où aucun acteur FR/EU n'est encore positionné.

Chine/AsieOpinion
1 source
Le robot humanoïde d'AGIBOT s'illustre par la danse et la calligraphie lors d'un événement culturel
94Interesting Engineering 

Le robot humanoïde d'AGIBOT s'illustre par la danse et la calligraphie lors d'un événement culturel

Le 21 mai 2026, la société chinoise AGIBOT a présenté son humanoïde pleine taille A2 lors d'un événement culturel à Jakarta, organisé en partenariat avec ASIX, accélérateur d'IA indonésien. Devant un public mixte, le robot a participé à une session de calligraphie en binôme avec des artistes humains, traçant la phrase "Tea for Harmony", avant d'enchaîner des performances de danse et des fonctions d'hôte interactif. Abel Deng, directeur régional Moyen-Orient et Asie-Pacifique d'AGIBOT, a qualifié 2026 de "jalon critique" pour atteindre un état de déploiement opérationnel, et a listé les applications industrielles et commerciales ciblées pour l'Indonésie : chargement et déchargement sur lignes de production, tri logistique, guidage en espace public, assistance retail, patrouilles de sécurité, inspections et nettoyage commercial. Aucun volume de déploiement, aucun tarif ni spécification technique détaillée du robot A2 n'ont été communiqués lors de l'événement. Il convient de distinguer nettement ce qui a été montré à Jakarta, une démonstration à visée culturelle et commerciale, de ce qui constitue un déploiement réel. Sur ce dernier point, AGIBOT avait franchi un cap concret plus tôt cette année en intégrant ses robots G2 sur une ligne de fabrication de tablettes active chez Longcheer Technology, l'un des premiers usages documentés d'un humanoïde en production d'électronique grand public. Le showcase jakartan relève davantage du positionnement géographique que de la mise en production. L'implication d'ASIX comme partenaire local signale une approche d'adaptation culturelle que plusieurs intégrateurs régionaux jugent indispensable pour réduire les frictions d'adoption dans des marchés à forte sensibilité sociale, notamment en Asie du Sud-Est où l'automatisation progresse rapidement dans les secteurs industriel et de services. AGIBOT est l'un des constructeurs chinois d'humanoïdes les mieux capitalisés, aux côtés d'Unitree Robotics, de Fourier Intelligence et d'UBTECH. Le segment reste extrêmement concurrentiel à l'échelle mondiale : Figure Robotics (Figure 03), Tesla (Optimus Gen 3), Agility Robotics (Digit, déployé chez Amazon), Physical Intelligence (pi-0), NVIDIA (GR00T N2) et Boston Dynamics (Atlas électrique) définissent chacun leur propre lecture du marché entre dextérité, autonomie cognitive et industrialisation à grande échelle. La présence de l'A2 au Met Gala de New York quelques semaines avant Jakarta illustre la double logique de la stratégie AGIBOT : image de marque globale d'un côté, pénétration B2B régionale de l'autre. Les suites annoncées incluent des pilotes dans les secteurs industriels et de services en Indonésie, sans calendrier précis ni volumes confirmés à ce stade.

UELa percée d'AGIBOT en Asie du Sud-Est illustre la stratégie d'internationalisation des constructeurs chinois d'humanoïdes, renforçant indirectement la pression concurrentielle sur les acteurs industriels et robotiques européens.

Chine/AsieOpinion
1 source
HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique
95arXiv cs.RO 

HUSKY : système de skateboard humanoïde via contrôle corps entier conscient de la physique

Des chercheurs ont présenté sur arXiv (2602.03205) HUSKY, un framework permettant à l'humanoïde Unitree G1 de faire du skateboard de manière stable en conditions réelles. Un skateboard est une plateforme sous-actionnée soumise à des contraintes non-holonomes (le véhicule ne se déplace pas librement dans toutes les directions) dont l'inclinaison est mécaniquement couplée à l'orientation des trucks. HUSKY modélise ce couplage et décompose la tâche en deux phases : poussée du pied au sol et direction par inclinaison du corps (lean-to-steer), reliées par un mécanisme de transition guidé par trajectoire. Les mouvements de poussée sont appris via les Adversarial Motion Priors (AMP), une technique d'imitation générant des gestes naturels à partir de données de référence. Les tests sur le G1 démontrent une navigation agile en environnement réel. Ce travail pointe une limite structurelle des frameworks de contrôle whole-body actuels : ils supposent quasi-unanimement un sol statique et des contacts prévisibles. En modélisant la dynamique du couplage humain-objet, HUSKY montre qu'un humanoïde peut opérer sur un équipement mobile non conventionnel sans recalibration manuelle, ce qui ouvre la voie à des robots capables de manouvrer chariots ou palettes en environnement industriel. L'association d'un modèle physique du sous-système mécanique avec l'apprentissage par imitation constitue une approche plus robuste que les politiques entraînées en simulation pure, et le transfert sim-to-real semble validé sur un scénario concret. Les conditions précises des tests (vitesse, distance, taux d'échec) ne sont pas détaillées dans l'article, ce qui limite l'évaluation objective des performances annoncées. Le Unitree G1, humanoïde à 43 degrés de liberté vendu autour de 16 000 dollars, s'impose comme plateforme de référence pour la recherche en locomotion avancée aux côtés du Boston Dynamics Atlas et de l'Agility Digit. En 2025-2026, la recherche en contrôle whole-body dynamique s'accélère avec Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) et les politiques loco-manipulation développées à Carnegie Mellon. HUSKY se distingue en explorant le couplage avec des véhicules sous-actionnés plutôt que la manipulation d'objets statiques. Il s'agit pour l'instant d'une démonstration de recherche sans déploiement industriel annoncé, et les étapes suivantes naturelles incluent l'extension à d'autres véhicules (trottinette, vélo) ou des scénarios combinant locomotion et manipulation.

RecherchePaper
1 source
Vidéo : un chien robot traque les micro-fuites de gaz dans le gigantesque hub de stockage de CO₂ norvégien
96Interesting Engineering 

Vidéo : un chien robot traque les micro-fuites de gaz dans le gigantesque hub de stockage de CO₂ norvégien

Un robot quadrupède baptisé "Roberta", construit par la société suisse ANYbotics, patrouille l'installation Northern Lights d'Equinor sur les côtes de Norvège occidentale. Ce hub de stockage de carbone, largement automatisé, reçoit du CO2 liquide capturé dans des usines européennes et l'injecte en permanence dans des réservoirs géologiques situés à 2 500 mètres sous le fond marin. Roberta est un ANYmal D, certifié IP67 (étanche à la poussière et à l'eau), capable de naviguer sur des escaliers métalliques ouverts et des surfaces glissantes sous les tempêtes de la mer du Nord. Équipé de caméras thermiques, de capteurs de gaz et d'un système d'imagerie acoustique comprenant 64 microphones, il détecte les fuites microscopiques en repérant leurs sifflements haute fréquence bien avant tout opérateur humain. Chaque mois, ces quadrupèdes autonomes effectuent des rondes d'inspection sur plusieurs sites, cartographiant les concentrations de gaz, auditant les températures des équipements, et transmettant les données en temps réel à un centre de commande situé à trente minutes du site. Ce déploiement illustre un changement de paradigme opérationnel dans l'industrie lourde : plutôt que d'exposer des techniciens à des environnements hostiles en continu, le robot assure la surveillance permanente pendant que des modèles d'IA analysent les données et n'alertent les équipes humaines qu'en cas d'anomalie avérée. Les industriels utilisant ces quadrupèdes rapportent une réduction de 70 à 90 % de l'exposition humaine aux environnements dangereux. L'impact financier est également mesurable : déployé dans une cimenterie, l'ANYmal D a détecté des fuites d'air comprimé dont la réparation a réduit les émissions de CO2 de l'installation de 1 200 tonnes par an. Ces chiffres, bien qu'issus directement des communications d'ANYbotics, donnent un ordre de grandeur concret pour les décideurs qui évaluent le retour sur investissement de l'inspection autonome. Dans le secteur énergétique, où chaque micro-fuite représente un gaspillage économique et une pénalité carbone, le cas d'usage est particulièrement solide. ANYbotics, spin-off de l'ETH Zurich fondée en 2016 sous la direction du CEO Péter Fankhauser, s'est imposée comme l'un des leaders de l'inspection robotique industrielle aux côtés de Boston Dynamics (Spot) et de Ghost Robotics. La prochaine étape commerciale de la société est l'ANYmal X, présenté comme le premier robot quadrupède antidéflagrant au monde, conçu pour les zones ATEX (pétrole, gaz, chimie) où les gaz combustibles rendent dangereux tout équipement susceptible de produire des étincelles. Il s'agit pour l'instant d'une annonce de lancement commercial imminent, pas encore d'un produit déployé à grande échelle. Le déploiement sur Northern Lights, premier projet de capture et stockage de CO2 industriel à grande échelle en Europe, positionne ANYbotics sur un segment stratégique appelé à croître avec le durcissement des réglementations carbone de l'UE et la multiplication des infrastructures CCS sur le continent.

UELe déploiement sur Northern Lights, première infrastructure CCS industrielle à grande échelle en Europe, positionne l'inspection robotique autonome comme solution stratégique pour les opérateurs d'infrastructures énergétiques européens soumis au durcissement des réglementations carbone de l'UE.

IndustrielActu
1 source
Pourquoi Tesla mise des milliards sur Optimus
97Robot Magazine FR 

Pourquoi Tesla mise des milliards sur Optimus

Tesla a engagé un pivot stratégique majeur vers la robotique humanoïde avec son robot Optimus, présenté pour la première fois en 2021 et progressivement monté en priorité interne. Selon des déclarations publiques répétées d'Elon Musk courant 2024-2025, le groupe recrute massivement des ingénieurs en vision par ordinateur, robotique et IA, sans que des chiffres précis d'investissement ou de volumes de production n'aient été officiellement communiqués. Musk a qualifié Optimus de "produit le plus important de Tesla", positionnant le robot comme une plateforme capable d'intervenir dans les usines, entrepôts, logistique et services grand public. À date, Tesla a publié des démonstrations vidéo d'Optimus réalisant des tâches manuelles en environnement contrôlé. Il n'existe pas encore de déploiement industriel à l'échelle documenté ni de prix catalogue annoncé pour des tiers. L'intérêt stratégique d'Optimus repose sur une hypothèse structurelle : le marché des robots humanoïdes polyvalents pourrait dépasser celui de l'automobile à long terme. Pour les décideurs industriels, la promesse est réelle, les humanoïdes pourraient théoriquement remplacer des postes de travail répétitifs sans reconfigurer entièrement les lignes de production, contrairement aux bras industriels fixes. Mais l'écart entre démonstration et déploiement opérationnel reste considérable. Le "demo-to-reality gap" n'est pas comblé : aucun constructeur, ni Tesla, ni Figure AI, ni Boston Dynamics, n'a prouvé une fiabilité suffisante en conditions réelles non supervisées à grande échelle. Ce que le pivot Tesla prouve, c'est que la narration "constructeur automobile" ne suffit plus à soutenir une valorisation boursière qui restait, début 2025, un multiple très élevé par rapport aux revenus automobiles nets. Tesla arrive sur un marché humanoïde déjà encombré. Figure AI (Figure 03, en partenariat avec BMW) a annoncé des déploiements en usine. Agility Robotics (Digit) est en production chez Amazon. Physical Intelligence (pi-0) et 1X Technologies progressent sur les modèles fondationnels robotiques. Boston Dynamics positionne Atlas sur les environnements industriels difficiles. NVIDIA soutient l'écosystème via GR00T et la plateforme Isaac. La Chine industrialise rapidement avec Unitree et Fourier Intelligence. Tesla dispose d'un avantage potentiel : l'accès à d'immenses volumes de données réelles via ses véhicules et ses usines, et une chaîne de fabrication à bas coût. Mais la pression concurrentielle sur l'automobile, notamment de BYD, Xiaomi et Xpeng, comprime les marges et renforce l'urgence de diversifier les revenus. Une éventuelle IPO de SpaceX constitue un risque de dilution d'attention capitalistique supplémentaire pour Tesla. Les prochaines étapes à surveiller : un déploiement interne dans les Gigafactories, et une éventuelle communication sur les métriques de fiabilité opérationnelle.

HumanoïdesOpinion
1 source
CMC-Opt : variété contrainte à coins pour l'optimisation sous contraintes d'inégalité
98arXiv cs.RO 

CMC-Opt : variété contrainte à coins pour l'optimisation sous contraintes d'inégalité

Une équipe de chercheurs a publié début mai 2026 sur arXiv (2605.20796) CMC-Opt, un framework d'optimisation sous contraintes pour la robotique reposant sur la géométrie différentielle. L'idée centrale : transformer un problème d'optimisation avec contraintes d'égalité et d'inégalité mélangées en un problème non contraint, résolu directement sur l'espace d'état contraint. Pour cela, les auteurs introduisent la notion de "constraint manifolds with corners" (CMC), une extension des variétés différentielles classiques capable de représenter les régions de l'espace d'état satisfaisant simultanément des contraintes nonlinéaires mixtes. Les algorithmes d'optimisation sur variétés sont ensuite adaptés à cette nouvelle structure topologique. Le framework est validé sur un problème de planification kinodynamique à grande échelle, domaine où les méthodes standards échouent à générer des trajectoires dynamiquement faisables. L'intérêt technique est réel : la planification de trajectoires sous contraintes physiques (limites articulaires, évitement de collisions, dynamique du corps entier) est un verrou central pour les robots humanoïdes et les manipulateurs industriels. Les approches classiques comme SQP ou les méthodes de point intérieur peinent à passer à l'échelle ou à gérer des contraintes d'inégalité actives de façon robuste. CMC-Opt propose une alternative géométrique qui évite la pénalisation ou les variables de relâchement, en restant sur la variété admissible, ce qui peut réduire les oscillations numériques et améliorer la convergence. Ce travail s'inscrit dans une tendance active en planification robotique : l'usage des variétés de contraintes (TSR, Atlas, variétés implicites) popularisé par des groupes comme celui de Dmitry Berenson ou les équipes CMU Robotics. Il reste à ce stade un preprint non soumis à peer review, sans benchmark comparatif exhaustif ni code publié annoncé, ce qui limite l'évaluation indépendante des performances revendiquées.

RecherchePaper
1 source
RoboJailBench : évaluation des attaques et défenses adversariales dans les agents robotiques incarnés
99arXiv cs.RO 

RoboJailBench : évaluation des attaques et défenses adversariales dans les agents robotiques incarnés

Des chercheurs du PurSec Lab ont publié RoboJailBench, un benchmark standardisé pour évaluer les attaques adversariales de type "jailbreak" et leurs contre-mesures dans les systèmes d'IA embarquée. Présenté sur arXiv (2605.19328), ce framework cible les agents robotiques et véhicules autonomes qui s'appuient sur des Vision-Language Models (VLMs) pour interpréter l'environnement visuel et exécuter des commandes en langage naturel. Il repose sur trois composantes: une taxonomie de sécurité dérivée des normes ISO et d'incidents documentés, couvrant 18 catégories de violations; un pipeline de données "intent contrast" associant à chaque exemple un objectif adversarial et un objectif bénin, afin de mesurer conjointement sécurité et utilité; et un dépôt évolutif de métriques standardisées. Les auteurs ont construit un dataset taxonomique, enrichi cinq datasets existants, intégré quatre types d'attaques et deux défenses, puis évalué l'ensemble sur les principaux VLMs embarqués actuels. Un leaderboard public est maintenu sur purseclab.github.io. L'enjeu dépasse la recherche académique. Un robot compromis par un jailbreak n'affiche pas une réponse textuelle inappropriée: il exécute une action physique potentiellement dangereuse. Les benchmarks existants ciblaient soit les LLMs conversationnels, soit la sécurité non-adversariale des agents incarnés, sans jamais capturer le triptyque risques adversariaux, conséquences physiques et arbitrage sécurité-utilité. Quantifier explicitement ce compromis est une contribution méthodologique significative: un système trop défensif bloque des commandes légitimes et devient inutilisable en production. Pour les intégrateurs industriels, une grille d'évaluation ancrée dans les normes ISO simplifie la qualification réglementaire avant tout déploiement réel. La montée en puissance des VLMs dans la robotique physique, illustrée par pi0 de Physical Intelligence, GR00T N2 de NVIDIA ou les architectures de Figure AI, a considérablement élargi la surface d'attaque des systèmes autonomes. Des travaux antérieurs avaient documenté la vulnérabilité des agents embarqués aux jailbreaks visuels ou textuels, mais sans cadre d'évaluation reproductible. Alors que des fabricants comme Boston Dynamics, Unitree ou, côté européen, Enchanted Tools intègrent des VLMs en production, la robustesse adversariale est appelée à devenir une exigence réglementaire dans les secteurs logistique, manufacturier et médical. RoboJailBench pose une base commune sur laquelle industriels et académiques peuvent s'appuyer pour standardiser ces tests avant mise en service.

UELe benchmark RoboJailBench, ancré dans les normes ISO, fournit aux intégrateurs européens, dont Enchanted Tools (France) qui déploie des VLMs en production, un cadre standardisé pour qualifier la robustesse adversariale avant mise en service sous les exigences de l'AI Act.

Societe/EthiqueOpinion
1 source
La sécurité des robots domestiques repose avant tout sur la relation humain-machine
100IEEE Spectrum Robotics 

La sécurité des robots domestiques repose avant tout sur la relation humain-machine

L'Organisation internationale de normalisation (ISO) révise ISO 13482, sa norme de sécurité pour les robots de soin personnel, vieille de douze ans. La mise à jour est actuellement en phase d'approbation finale. Elle couvre l'identification des dangers, l'évaluation des risques et différents scénarios d'utilisation, mais n'établit ni seuils contraignants, ni méthodes de test, ni mécanismes d'application pour les risques liés à l'interaction humain-robot. C'est précisément ce manque que dénonce Jae-Seong Lee, chercheur en politique technologique à l'Electronics and Telecommunications Research Institute de Daejeon (Corée du Sud), dans une interview accordée à IEEE Spectrum. La norme entre en phase finale au moment où les fabricants d'humanoïdes domestiques basculent des prototypes de laboratoire vers des produits destinés à de vraies maisons, de vrais aidants et de vraies familles. Le problème central identifié par Lee est autant conceptuel que technique : la sécurité d'un robot domestique n'est pas une propriété fixe de la machine, elle émerge de la relation entre le robot et l'humain. L'interaction est bidirectionnelle, le robot modifie le comportement de l'humain, et l'humain modifie ce que le robot perçoit et décide ensuite. Les normes industrielles classiques peuvent borner la tâche, l'espace de travail et la population concernée. Dans un domicile, le robot doit s'adapter à des personnes âgées, des enfants, des visiteurs, des animaux, du désordre et des espaces confinés. Ce ne sont pas des cas marginaux : c'est le cadre opérationnel de base. Contraindre l'enveloppe d'un humanoïde domestique pour la rapprocher d'un robot industriel reviendrait à annuler son utilité. Par ailleurs, les entreprises qui constituent les jeux de données d'entraînement envoient déjà des travailleurs salariés filmer leurs tâches quotidiennes dans des logements ordinaires à travers le monde, ancrant la variabilité réelle du terrain dans les modèles. Le problème de sécurité se situe donc au niveau du système humain-robot complet, pas d'un composant isolé. ISO 13482 avait été publiée en 2014, dans un contexte où les robots de soin se limitaient à des assistants de mobilité et des plateformes relativement simples. Douze ans plus tard, des acteurs comme Figure AI, Boston Dynamics, 1X ou Agility Robotics positionnent des humanoïdes polyvalents comme prochaine étape du travail domestique et du maintien à domicile. En Europe, des entreprises comme Enchanted Tools avec son Mirokaï ou Wandercraft évoluent dans des environnements réglementaires similaires, ce qui leur confère une exposition directe à ce vide normatif. Le déficit identifié par Lee est avant tout un déficit de gouvernance : la communauté technique comprend le couplage bidirectionnel, le cadre normatif reconnaît les dangers associés, mais aucune norme ne traduit aujourd'hui cette compréhension en règles applicables pour l'autonomie domestique. Une question reste aussi ouverte : qui décide quel comportement humain est "normal" ? Quelle démarche sert de référence, et quel seuil de risque est acceptable pour une personne âgée à mobilité réduite par rapport à un adulte valide ? Sans réponse à ces questions, la prochaine génération de robots domestiques arrivera sur le marché sans cadre de sécurité adapté à sa réalité opérationnelle.

UEEnchanted Tools (Mirokaï) et Wandercraft sont explicitement cités comme directement exposés au vide normatif d'ISO 13482, qui n'impose aucun seuil contraignant ni méthode de test pour l'autonomie domestique.

RegulationReglementation
1 source