Aller au contenu principal

Dossier Tesla Optimus — page 2

171 articles · page 2 sur 4

Optimus, le pari humanoïde de Tesla : itérations Gen 1, Gen 2, Gen 3, intégration FSD pour la perception, démonstrations live et critiques sur les vidéos téléopérées.

CWI : système d'imitation du corps entier pour la loco-manipulation de robots humanoïdes
51arXiv cs.RO RecherchePaper

CWI : système d'imitation du corps entier pour la loco-manipulation de robots humanoïdes

Des chercheurs ont publié fin juin 2026 sur arXiv (réf. 2606.27676) le framework CWI (Composite Whole-Body Imitation), une architecture de contrôle pour robots humanoïdes visant à coordonner locomotion et manipulation bimanuelle en simultané. Le système a été évalué en simulation puis déployé sur un LimX Oli, humanoïde pleine taille du fabricant chinois LimX Robotics. L'approche repose sur une dissociation du recours aux données de capture de mouvement (MoCap) : les données MoCap de manipulation diversifiées pilotent le contrôle du haut du corps, tandis que la locomotion est guidée par deux discriminateurs adversariaux (Adversarial Motion Prior, AMP) entraînés sur des clips curatés de marche et d'accroupissement. Une architecture multi-critique réduit les conflits entre objectifs de locomotion, de manipulation et de style de mouvement ; une étape de distillation enseignant-élève produit ensuite une politique conditionnée uniquement sur les poses des mains et des commandes de vitesse et hauteur. La loco-manipulation reste l'un des verrous majeurs de la robotique humanoïde. Les méthodes purement par renforcement, sans MoCap, souffrent de récompenses creuses et nécessitent des curricula finement réglés ; les méthodes imitant le corps entier butent sur le déséquilibre des datasets, les trajectoires de locomotion trop dynamiques dégradant la stabilité globale. CWI propose une dissociation architecturale qui contourne les deux écueils. Le résultat pratique est une téléopération sans équipement MoCap complet, ce qui abaisse le seuil d'intégration industrielle. Pour les intégrateurs et les décideurs B2B, cela signifie qu'un humanoïde capable d'agir dans des environnements mixtes (déplacements et saisie d'objets) devient envisageable sans infrastructure de capture de mouvement coûteuse. Cela dit, la publication ne fournit aucune métrique de temps de cycle ni de volumes de déploiement, ce qui invite à lire ces résultats comme une preuve de concept compétitive, pas comme un produit shipé. CWI s'inscrit dans une vague de travaux combinant apprentissage par renforcement et imitation de mouvement humain, dont l'Adversarial Motion Prior (AMP) de Peng et al. constitue la brique fondatrice. LimX Robotics reste un acteur discret face aux mastodontes du secteur : Figure AI (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0) ou encore Boston Dynamics (Atlas) travaillent sur des architectures comparables intégrant contrôle corps entier et politiques Vision-Language-Action (VLA). CWI ne mentionne ni calendrier de déploiement industriel, ni partenariat commercial : il s'agit d'un preprint arXiv sans revue par les pairs publiée. Les prochaines étapes probables passeront par une validation en conditions réelles plus variées et une publication dans une conférence robotique de référence (ICRA, IROS ou RAL).

1 source
OmniContact : enchaînement de méta-compétences par flux de contact pour la loco-manipulation humanoïde généralisable
52arXiv cs.RO 

OmniContact : enchaînement de méta-compétences par flux de contact pour la loco-manipulation humanoïde généralisable

Des chercheurs ont publié le 26 juin 2026 sur arXiv (réf. 2606.26201) un framework hiérarchique baptisé OmniContact, conçu pour enchaîner des séquences complexes de locomotion et manipulation sur des humanoïdes. Le coeur du système est une représentation intermédiaire appelée "contact flow" (CF): trajectoires corporelles clés et signaux binaires de contact en série temporelle. Deux modules s'appuient dessus, CF-Track (politique bas-niveau, bibliothèque de compétences unifiée) et CF-Gen (planificateur haut-niveau heuristique qui synthétise les séquences futures). En simulation, les résultats annoncés atteignent 98,7% de succès sur la tâche "Carry Box" et 76,5% sur "Push-Stack Boxes", soit respectivement +40,9% et +66,5% face aux baselines sur l'exécution de méta-compétences et leur enchaînement. Le dataset OmniContact, constitué via capture de mouvement (MoCap) d'interactions humain-objet, supporte l'entraînement. Le vrai défi des humanoïdes industriels n'est pas l'exécution d'un geste unitaire mais l'enchaînement robuste de séquences longues avec récupération autonome en cas de défaillance, ce verrou précis que OmniContact cible. Le système propose une interface structurée lisible par le planificateur haut-niveau, une voie médiane entre représentations explicites trop rigides pour la planification et embeddings implicites trop opaques pour la composition fiable. L'intégration avec des VLMs (Vision-Language Models) permettrait des instructions en langage naturel converties en séquences de contact flows, comme l'illustre la démonstration d'arrangement de boîtes en forme de coeur. Nuance importante: toutes les métriques publiées sont issues de conditions contrôlées en laboratoire, sans validation sur hardware physique ni déploiement industriel réel, ce qui laisse entier le problème du sim-to-real. La loco-manipulation longue horizon est devenu le benchmark officieux du secteur humanoïde en 2025-2026. Figure AI (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (pi0) et Boston Dynamics s'affrontent sur des tâches de plus en plus généralisables, tandis que NVIDIA pousse GR00T N2 comme couche de policy universelle. OmniContact vient du monde académique, sans entreprise identifiée derrière ce preprint, mais son approche par contact flow s'inscrit dans la tendance des représentations intermédiaires structurées, en parallèle des architectures VLA à diffusion. La collecte MoCap dédiée aux interactions humain-objet sur humanoïdes confirme que les données de référence restent un goulot d'étranglement même quand la simulation abonde. La prochaine étape déterminante sera le transfert sur un humanoïde physique, condition sine qua non pour que ce framework passe du laboratoire au hangar.

RecherchePaper
1 source
RoboRouter : sélection de politiques sans entraînement pour la manipulation robotique
53arXiv cs.RO 

RoboRouter : sélection de politiques sans entraînement pour la manipulation robotique

Des chercheurs ont publié RoboRouter (arXiv:2603.07892, version 4), un système de routage intelligent entre politiques robotiques hétérogènes pour les tâches de manipulation. Plutôt que d'entraîner une nouvelle politique monolithique, RoboRouter maintient un pool de politiques existantes -- modèles vision-langage-action (VLA), politiques vision-action (VA) et approches compositionnelles par code -- et sélectionne automatiquement la meilleure pour chaque nouvelle tâche. Le mécanisme repose sur une représentation sémantique de la tâche, une recherche dans l'historique d'exécutions similaires, puis une prédiction directe sans trial-and-error. Le retour structuré après chaque exécution affine les décisions suivantes. En simulation et en conditions réelles, RoboRouter améliore le taux de succès moyen de plus de 3 points en simulation et de 13 points en environnement réel par rapport aux politiques individuelles, sans dégradation de la vitesse d'exécution. Intégrer une nouvelle politique dans le système ne requiert qu'une évaluation légère, sans coût de réentraînement. Ce résultat a une portée concrète pour les intégrateurs. Le problème central de la manipulation robotique est que chaque paradigme excelle sur sa distribution d'entraînement mais généralise mal hors distribution. RoboRouter contourne ce mur non pas en cherchant un meilleur modèle universel, mais en exploitant les forces complémentaires de politiques spécialisées existantes. Le gain de 13 % en réel est notable car le sim-to-real gap ronge habituellement les gains obtenus en simulation. L'absence de réentraînement signifie que le système peut absorber de nouveaux modèles au fil du temps -- une propriété utile à mesure que les VLA comme Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) sortent des cycles de recherche pour entrer en déploiement. Ce travail prend place dans un contexte de prolifération rapide des paradigmes de contrôle robotique. Les équipes de Figure (Figure 03), Tesla (Optimus Gen 3) ou 1X parient sur l'unification via un seul grand modèle entraîné à grande échelle. RoboRouter incarne une thèse adverse: l'hétérogénéité contrôlée, avec un orchestrateur léger, peut surpasser la politique unique sans le coût computationnel associé. Les auteurs ne précisent pas de déploiement industriel annoncé ni de partenariats, ce qui place cette contribution dans le registre recherche applicable plutôt que produit shipé. Les prochaines étapes naturelles seraient l'évaluation sur des benchmarks standardisés plus larges (LIBERO, RoboSuite) et l'intégration de politiques récentes à mesure qu'elles sont rendues publiques.

IA physiqueOpinion
1 source
Mantis Robotics lance un robot bimanuel sans clôture de protection
54Robotics Business Review 

Mantis Robotics lance un robot bimanuel sans clôture de protection

Mantis Robotics, basée à Pleasanton en Californie, a dévoilé le 23 juin 2026 le MR-X, un robot bimanuel conçu pour opérer sans cage ni barrière de sécurité physique dans des environnements industriels partagés avec des humains. Le système affiche un payload de 31,7 kg (70 lb) et une vitesse maximale de 10,6 m/s. Il repose sur la plateforme SafetyCore, un système de réflexes en temps réel breveté par l'entreprise, qui analyse en continu l'environnement et ajuste le comportement du robot dès qu'un opérateur entre dans sa trajectoire, sans arrêt de cycle. Le MR-X est conçu pour des installations fixes comme pour des déploiements en manipulateur mobile (mobile manipulator), et cible des tâches d'assemblage bimanuel, de transfert de matière et de tri de colis. Il embarque une interface de programmation sans code. Mantis présentait les MR-X et MR-1 au salon Automate 2026 (stand 1261, South Hall). Ce lancement illustre une tentative de positionnement entre deux segments qui peinent à se rejoindre : les cobots (lents, sûrs, peu puissants) et les robots industriels classiques (rapides mais nécessitant une intégration de sécurité lourde). Si les métriques annoncées sont confirmées en conditions réelles, un système combinant vitesse industrielle, double bras et opération sans barrière représenterait un avantage d'intégration significatif pour les lignes mixtes homme-robot. L'absence de fence élimine des coûts d'infrastructure et réduit la surface au sol allouée à la cellule robotique, deux points critiques pour les PME industrielles et les entrepôts logistiques. Cela dit, l'article repose sur des déclarations de l'entreprise : aucune donnée indépendante sur le temps de cycle en conditions de production, ni sur la robustesse du SafetyCore face à des scénarios non contrôlés n'est fournie. La mention d'Amazon comme référence de leur MR-1 reste vague, sans volume ni contexte de déploiement précisé. Mantis Robotics s'appuie sur son MR-1, certifié ISO 10218 et ISO 13849, qui aurait déjà démontré la viabilité de l'opération sans fence à vitesse industrielle. Le MR-X étend cette architecture à un format bimanuel, une tendance forte en 2025-2026 face à la montée des humanoides (Figure 03, Tesla Optimus Gen 3, 1X Neo) qui promettent la même polyvalence mais accusent encore un écart significatif entre démo et réalité opérationnelle. Dans le segment fenceless cobots, Mantis affronte des acteurs comme Universal Robots, FANUC CRX et Techman Robot, tandis que sur le bimanuel industriel, ABB YuMi et Rethink Robotics (désormais absent) ont montré les limites du segment. Aucun calendrier de disponibilité commerciale ni prix indicatif n'a été communiqué lors de l'annonce, ce qui place le MR-X davantage côté teaser produit que lancement commercial effectif.

UEPression concurrentielle indirecte sur ABB (YuMi) et Universal Robots, tous deux leaders européens du segment cobot/bimanuel, mais aucun déploiement ni partenariat européen annoncé.

IndustrielOpinion
1 source
Kunlun Xing, startup d'IA incarnée, lève plusieurs milliards de yuans et devient licorne en 90 jours
5536Kr 

Kunlun Xing, startup d'IA incarnée, lève plusieurs milliards de yuans et devient licorne en 90 jours

Moins de quatre-vingt-dix jours après son enregistrement officiel, la startup de robotique humanoïde chinoise Kunlun Xing (昆仑行) a bouclé trois tours de financement successifs pour un total de plusieurs milliards de yuans, franchissant le seuil du milliard de dollars de valorisation avant même d'avoir sorti un produit. C'est le 36Kr qui révèle ces informations en exclusivité. La société est fondée par Ren Geng, ancien vice-président du groupe Alibaba et ex-président d'Alibaba Cloud Chine, accompagné de Lang Xianpeng, premier ingénieur ADAS de Li Auto, l'équivalent chinois de Mobileye au sein du constructeur. Les investisseurs présents dès le premier tour, dont Hillhouse Capital, Gaorong Ventures, CASSTAR et Huaye Capital, ont participé aux trois rounds consécutifs, un signal fort de conviction. Le tour de table réunit également Zhongding Capital, Innovation Works (le fonds de Kai-Fu Lee), Xin Capital, et le bras industriel du conglomérat Jianfa Group. La stratégie affichée par Kunlun Xing est le développement en intégration totale (full-stack) d'un robot humanoïde généraliste, explicitement positionné comme concurrent de l'Optimus de Tesla, avec une architecture duale baptisée Kunlun World Model (KWM) censée améliorer la généralisation et réduire l'opacité décisionnelle des modèles de type VLA. Ce financement record illustre la tension qui structure le marché chinois de la robotique humanoïde en 2026 : les capitaux sont abondants, mais les cibles crédibles rares. Plusieurs fonds de premier rang interrogés par 36Kr reconnaissent se retrouver en position de "demandeurs" face aux meilleurs dossiers, non l'inverse. Ce qui différencie Kunlun Xing aux yeux des investisseurs, c'est la combinaison inhabituelle de compétences de go-to-market à grande échelle (Ren Geng a piloté Alibaba Cloud à 42,1 % de part de marché public cloud en 2020) et de capacités de livraison hardware à volume (Lang Xianpeng a délivré l'ADAS Li Auto sur 1,5 million de véhicules avec un budget annuel de recherche de 10 millions de yuans). Dans un secteur où la plupart des acteurs sont soit purement techniques, soit purement commerciaux, cette dualité est jugée décisive. La stratégie "corps + cerveau" en développement propriétaire vise à éviter le découplage logiciel-matériel qui pénalise nombre de concurrents. Le contexte sectoriel qui nourrit cette levée tient à plusieurs catalyseurs simultanés : l'annonce par Tesla d'une production en petite série de l'Optimus Gen3 à l'usine de Fremont entre juillet et août 2026, l'introduction en bourse accélérée de Unitree Robotics, et les prévisions de Morgan Stanley évaluant le marché mondial des robots humanoïdes à 5 000 milliards de dollars d'ici 2050. Kunlun Xing n'est toutefois pas seul sur ce segment : Figure AI, 1X, Agility Robotics et Fourier Intelligence occupent le terrain international, tandis que Unitree, Agibot (智元) et Zhiyuan Robot (智元) disputent le marché domestique. Les défis techniques restent concrets : la durée de vie des mains dextres dépasse rarement deux mois, et la supply chain composants n'est pas encore industrialisée. Kunlun Xing n'a pour l'heure annoncé ni prototype public, ni calendrier de livraison client, ni déploiement pilote, sa valorisation repose intégralement sur la crédibilité de l'équipe fondatrice, pas sur des métriques produit vérifiables.

Chine/AsieActu
1 source
ACE-Ego-0 : unification des données égocentrées humaines et robotiques pour le préentraînement VLA
56arXiv cs.RO 

ACE-Ego-0 : unification des données égocentrées humaines et robotiques pour le préentraînement VLA

Pré-publiée sur arXiv en juin 2026 (identifiant 2606.17200), ACE-EGO-0 est un cadre de pretraining pour modèles Vision-Langage-Action (VLA) qui exploite conjointement 4 530 heures de données robotiques et de simulation, et 1 480 heures de vidéos égocentrées humaines converties en pseudo-trajectoires robot. Le pipeline automatise la transformation de vidéos à la première personne en séquences d'actions au format démonstration téléopérée, en représentant les mouvements dans l'espace caméra plutôt que dans un référentiel corporel. Pour atténuer le bruit inhérent à ces pseudo-labels, un objectif d'entraînement reliability-aware concentre la supervision sur les segments les plus fiables via une perte auxiliaire dédiée. Évalué sur RoboCasa GR1 TableTop (robot humanoïde GR1 de Fourier Intelligence) et RoboTwin 2.0, ACE-EGO-0 atteint les meilleures performances publiées sur les deux benchmarks et démontre, selon les auteurs, un transfert vers la manipulation bimanuelle en conditions réelles. L'apport central est la résolution d'un problème structurel : les divergences d'espaces d'action, de morphologie et de dynamiques temporelles entre humains et robots rendaient jusqu'ici l'entraînement conjoint instable ou contre-productif. En unifiant la représentation via des actions caméra-space et un time-aligned action chunking avec morphology conditioning, les auteurs montrent que des jeux de données égocentrés existants comme Ego4D ou EPIC-Kitchens peuvent fournir un signal complémentaire valide à grande échelle. Pour les équipes R&D en robotique, l'implication pratique est directe : réduire significativement le coût de collecte de trajectoires robot, l'un des principaux goulots d'étranglement du déploiement VLA à l'échelle industrielle. La course aux politiques robotiques généralisables s'est accélérée depuis Pi-0 de Physical Intelligence (novembre 2024), OpenVLA et RT-2 de Google DeepMind. Des travaux antérieurs comme Dobb-E ou Human2Robot avaient déjà exploré les données humaines égocentrées comme supervision complémentaire, mais sans framework unifié à cette échelle ni évaluation systématique. ACE-EGO-0 propose une recette reproductible évaluée sur deux benchmarks de référence, dont RoboTwin 2.0, particulièrement pertinent car la manipulation bimanuelle reste un défi ouvert pour les humanoïdes commerciaux tels que Figure 03, Optimus Gen 3 ou Unitree H1. La prépublication ne mentionne ni partenaire industriel ni déploiement annoncé : ACE-EGO-0 est pour l'instant une contribution de recherche, pas un produit livrable.

IA physiqueOpinion
1 source
Genesis AI lance Eno, son robot polyvalent
57Robotics Business Review 

Genesis AI lance Eno, son robot polyvalent

Genesis AI a dévoilé le 16 juin 2026 Eno, son robot à usage général, accompagné de GENE, le modèle de fondation développé en interne pour piloter le système. Contrairement aux approches humanoïdes bipedaleset bipèdes dominantes dans le secteur, Eno repose sur une base roulante surmontée d'une colonne articulée dont la hauteur est ajustable en temps réel, permettant au robot de se replier pour le stockage ou d'étendre sa portée selon la tâche. Ses bras sont équipés de mains propriétaires à cinq doigts conçues pour manipuler des outils et objets calibrés pour des utilisateurs humains. Le robot intègre en option un écran affichant en temps réel l'état cognitif du système, c'est-à-dire les intentions et raisonnements en cours, un choix de design rare dans l'industrie. La société, basée à San Carlos en Californie et financée à hauteur de 105 millions de dollars en seed en 2025, prévoit de lancer la production et les premiers déploiements clients d'ici fin 2026, en ciblant en priorité les secteurs industriels (manufacturing, logistique, laboratoires), avant d'adresser l'hôtellerie, les hôpitaux, puis le grand public. L'annonce est notable non pas tant pour les performances revendiquées que pour le positionnement architectural choisi. En optant pour une base mobile sur roues plutôt que la locomotion bipedaleet bipède, Genesis AI fait le pari de la fiabilité opérationnelle sur des sols industriels plats plutôt que de la polyvalence locomotrice, ce qui réduit la complexité mécanique et le risque de chute tout en simplifiant l'intégration en entrepôt et en laboratoire. La transparence cognitive via l'écran intégré est un signal adressé aux opérateurs et intégrateurs, chez qui la confiance dans les décisions autonomes du robot reste un frein réel au déploiement. GENE est présenté comme un système capable de gérer des tâches longues et séquentielles en raisonnant sur le contexte, sans se limiter à des commandes isolées, ce qui correspond à la catégorie des VLA (Vision-Language-Action models) appliqués à la manipulation. Les affirmations de "précision au millimètre" et de "manipulation au niveau humain" restent à valider indépendamment : aucune métrique de benchmark externe n'est citée dans l'annonce. Genesis AI arrive sur un marché déjà très occupé. Figure AI (Figure 03), Physical Intelligence (Pi-0), Boston Dynamics (Atlas), Agility Robotics (Digit) et Tesla (Optimus Gen 3) sont déjà en phase de déploiement pilote ou de production limitée. Nvidia pousse GR00T N2 comme socle commun pour les VLA humanoïdes. Dans ce contexte, Eno se distingue par son format non humanoïde et son interface de transparence, deux paris qui tranchent avec la convergence du secteur vers le robot bipède anthropomorphe. La co-conception corps-cerveau revendiquée par Genesis, où le hardware et le modèle GENE auraient été développés conjointement dès l'origine, reste une tendance lourde que l'on retrouve chez 1X Technologies ou Apptronik. Les prochaines étapes annoncées restent vagues : "déploiements ciblés" fin 2026 sans noms de clients ni volumes. L'annonce est pour l'instant une présentation publique de concept, pas un produit en livraison.

IA physiqueOpinion
1 source
X-Loco : vers un contrôle généraliste de la locomotion humanoïde par distillation synergique de politiques
58arXiv cs.RO 

X-Loco : vers un contrôle généraliste de la locomotion humanoïde par distillation synergique de politiques

Publié sur arXiv (2603.03733) en 2025, X-Loco est un framework d'entraînement d'une politique de locomotion généraliste basée sur la vision pour robots humanoïdes. L'approche repose sur une distillation synergétique : plusieurs politiques expertes sont entraînées séparément pour des compétences distinctes - locomotion bipède stable, récupération après chute, coordination corps entier, franchissement de terrains variés - puis une politique unique guidée par entrée visuelle est distillée à partir de ces experts via un mécanisme de sélection adaptative au cas par cas. X-Loco opère uniquement sur des commandes de vitesse, sans recours à des mouvements de référence issus de captures de mouvement. Les auteurs revendiquent une première dans l'intégration simultanée de toutes ces compétences dans une seule politique vision - affirmation à prendre avec les précautions d'usage pour un preprint non encore évalué par les pairs. Ce travail s'attaque à un verrou technique central : entraîner une politique unique qui maîtrise des comportements aux dynamiques radicalement différentes et aux objectifs de contrôle parfois contradictoires. Une telle politique simplifie le déploiement opérationnel en éliminant les modules de commutation entre comportements. L'absence de dépendance aux données de mocap rend également le pipeline d'entraînement plus scalable, puisqu'il ne requiert pas de bibliothèques de mouvements spécifiques à chaque compétence cible. Les études d'ablation incluses renforcent la crédibilité des choix architecturaux, mais les résultats restent cantonnés à la simulation et au laboratoire, sans validation sur hardware réel à grande échelle. X-Loco s'inscrit dans une dynamique de recherche intense sur la locomotion humanoïde, portée par des équipes comme Berkeley Humanoid, CMU et les labos gravitant autour d'Unitree. La distillation enseignant-étudiant est un paradigme établi en apprentissage par renforcement, mais son application à un spectre aussi large de compétences reste un défi ouvert. Côté commercialisation, Tesla (Optimus Gen 2), Figure AI, Boston Dynamics (Atlas) et 1X Technologies travaillent sur des problèmes similaires avec des ressources bien supérieures. La suite logique pour X-Loco serait une validation sim-to-real convaincante sur hardware physique, étape non encore franchie selon le papier.

RecherchePaper
1 source
SyLink Hand : main anthropomorphe à mécanisme de bielles inspiré des synergies pour une dextérité humaine
59arXiv cs.RO 

SyLink Hand : main anthropomorphe à mécanisme de bielles inspiré des synergies pour une dextérité humaine

Une équipe de chercheurs a publié en juin 2026 sur arXiv (preprint 2606.14250) les spécifications techniques de la SyLink Hand, une main robotique anthropomorphe de 520 grammes conçue pour reproduire la cinématique de la main humaine avec un budget de fabrication d'environ 400 dollars. La conception repose sur deux principes combinés : les synergies biomécaniques de la main humaine, identifiées grâce à des gants de capture de mouvement qui révèlent de fortes corrélations entre articulations voisines, et des mécanismes de liaisons rigides (linkages) qui coordonnent plusieurs joints à partir d'un seul actionneur. Résultat : 19 articulations pilotées par seulement 11 actionneurs. L'équipe introduit également une liaison à quatre barres sphérique originale permettant de découpler indépendamment la flexion/extension et l'abduction/adduction à l'articulation métacarpophalangienne (MCP), dans un encombrement compact. Ce rapport de 11 actionneurs pour 19 degrés de liberté est le point saillant de ce travail. Dans la plupart des mains dextres existantes, la multiplication des actionneurs fait exploser masse, coût et complexité de contrôle. En s'appuyant sur les synergies naturelles de la main (le fait que les doigts bougent rarement de façon totalement indépendante), les auteurs réduisent le problème sans sacrifier l'anthropomorphisme cinématique. Un coût de fabrication de 400 dollars positionne la SyLink Hand très en dessous des références académiques comme la Shadow Hand (plusieurs dizaines de milliers d'euros) ou l'Allegro Hand (Wonik Robotics, environ 4 000 dollars). Cela ouvre un couloir d'accessibilité pour la robotique de service, les plateformes de recherche ou l'intégration dans des humanoïdes à budget contraint. Reste à noter que les évaluations présentées sont expérimentales et issues d'un prototype de laboratoire : aucun déploiement industriel ni partenariat industriel n'est annoncé. Cette publication s'inscrit dans une compétition académique et industrielle dense autour des mains robotiques dextres. Shadow Robot (UK) domine le segment haute performance avec la Dexterous Hand, tandis que des projets open-source comme LEAP Hand (Carnegie Mellon, 2023) ou la main de Dexterous Robotics ciblent également le compromis coût/performance. Côté humanoïdes, Figure (Figure 03), Tesla (Optimus Gen 3) et Agility Robotics développent leurs propres solutions de préhension intégrées. En Europe, des acteurs comme Enchanted Tools (France) conçoivent des mains orientées interaction sociale. La SyLink Hand, en tant que preprint sans partenaire industriel déclaré, reste pour l'instant une contribution académique prometteuse. Les suites dépendront de sa capacité à passer des tests de lab aux conditions réelles d'utilisation, notamment en durabilité des liaisons mécaniques sous cycles répétés.

RecherchePaper
1 source
Main bionique MCR : structures anatomiques au service de la manipulation habile
60arXiv cs.RO 

Main bionique MCR : structures anatomiques au service de la manipulation habile

Une équipe de recherche publie sur arXiv (référence 2606.13601, juin 2026) la MCR-Bionic Hand, une main robotique biomimétique reproduisant à l'échelle 1:1 l'architecture musculo-squelettique de la main humaine. Le système intègre un poignet à deux rangées de huit os, des tendons croisés au poignet, un routage anatomique des fléchisseurs superficiels (FDS) et profonds (FDP), des contraintes de plaque palmaire et de ligaments collatéraux, le capuchon extenseur dorsal, ainsi que les voies musculaires intrinsèques (lombricaux, interosseux). L'architecture repose sur deux formes de "raisonnement structurel" : la génération de postures par défaut via la ténodèse poignet-doigts, qui transforme des entrées à faible dimension en configurations de préhension pré-formées et assure la coordination IPP-IPD ; et la modulation musculaire fine, qui règle la posture MCP, la stabilité distale et les trajectoires de force des doigts autour de cet état par défaut. Les démonstrations expérimentales couvrent des tâches de contact riche : rotation de pièce de monnaie, transfert de stylo, retournement dorsal de pièce et manipulation de cube. L'intérêt tient à un changement de paradigme dans la conception des mains robotiques. L'état de l'art traite la dextérité comme un problème de contrôle actif à haute dimension, où chaque degré de liberté est piloté par des algorithmes. Ici, la géométrie de la structure mécanique encode elle-même une partie du contrôle : la posture du poignet induit passivement une pré-mise en forme multi-articulaire, sans commande explicite, et le capuchon extenseur couple le mouvement IPP à une réponse IPD de manière entièrement mécanique. Ce mécanisme allège la charge de calcul et simplifie les pipelines de contrôle, ce qui est directement pertinent pour les intégrateurs cherchant à déployer des manipulateurs en environnements non structurés. La démonstration sur tâches à contact riche indique que le "sim-to-real gap" peut partiellement se résorber si la morphologie physique absorbe la complexité que le contrôleur devrait autrement gérer. Ce travail s'inscrit dans une ligne de recherche où dominent des systèmes comme la Shadow Hand (Shadow Robot, Royaume-Uni), l'Allegro Hand (Wonik Robotics) ou les mains embarquées sur des humanoïdes commerciaux tels que le Figure 03 ou l'Optimus Gen 3 de Tesla, la plupart s'appuyant sur un grand nombre d'actionneurs et des contrôleurs appris. La MCR-Bionic Hand, présentée comme preprint académique et non comme produit commercialisé, plaide pour un retour aux structures anatomiques fonctionnelles plutôt qu'à la simple ressemblance visuelle, une distinction que le secteur des prothèses actives, notamment Ottobock (Allemagne), pourrait exploiter. La suite naturelle serait une évaluation de robustesse sur cycles répétés et une intégration à des pipelines de manipulation apprise de type VLA, pour déterminer si ces priors structurels améliorent la généralisation hors distribution.

UEOttobock (Allemagne), leader européen des prothèses actives, est l'acteur EU le mieux positionné pour exploiter cette architecture musculo-squelettique dans ses futures générations de mains prothétiques.

RecherchePaper
1 source
L'équipe Tsinghua-Harvard développe Acorn, un robot « zéro-données » qui apprend par instinct, sans entraînement
61Pandaily 

L'équipe Tsinghua-Harvard développe Acorn, un robot « zéro-données » qui apprend par instinct, sans entraînement

La startup Acorn Robot, cofondée par le Dr. Jiang Yao (doctorat en génie mécanique à Tsinghua, postdoctorat en neurosciences à Harvard), a présenté un robot de manipulation capable d'apprendre des tâches physiques sans aucune donnée d'entraînement préalable, sans trajectoires de démonstration et sans modèle visuel. Le système repose sur un modèle de décision embarqué baptisé "Natus" (pour "instinct-driven behavioral emergence"), qui fonctionne par essais et erreurs en temps réel sur le matériel physique. Le hardware est délibérément minimaliste : une pince industrielle parallèle à 1 degré de liberté, équipée de capteurs tactiles sur ses deux mâchoires en V, sans caméra externe ni connexion cloud. La démonstration présentée montre le robot parvenir à saisir une carte bancaire posée à plat sur une table, un défi reconnu pour les préhenseurs industriels conventionnels, en utilisant une mâchoire comme levier contre le bord de la carte et la surface de la table comme point d'appui. Le système requiert typiquement huit à neuf tentatives pour converger vers cette stratégie. Selon la société, une preuve de concept a été validée chez l'un des principaux fabricants de cosmétiques en Chine, avec un déploiement à l'échelle annoncé. La cible commerciale visée est la fabrication flexible B2B, où l'adaptabilité prime sur le volume de données. L'approche représente une rupture philosophique avec le paradigme dominant de la robotique contemporaine, qui s'appuie massivement sur des données de démonstration, des modèles vision-langage-action (VLA) et de l'apprentissage par simulation. Le Dr. Jiang soutient que les forces de contact imprévisibles et les variations mécaniques entre robots individuels rendent les approches data-driven structurellement fragiles, décrivant la dépendance aux données comme un "puits sans fond impossible à combler" et affirmant qu'il n'existe pas de modèle universel, seulement un modèle optimal pour un robot donné. Pour les intégrateurs industriels et les décideurs en fabrication flexible, le claim est potentiellement significatif : un système capable de s'adapter à une nouvelle tâche physique sans pipeline de collecte de données ni infrastructure cloud réduit le coût de déploiement et le délai de mise en service. Il convient toutefois de nuancer : les huit à neuf tentatives annoncées proviennent d'une vidéo de démonstration sélectionnée, les conditions exactes du déploiement cosmétique ne sont pas détaillées, et la distinction entre preuve de concept validée et déploiement industriel à grande échelle reste à préciser. Acorn Robot s'inscrit dans un paysage robotique mondial où l'essentiel des investissements se concentre sur les humanoïdes dotés de VLA à grande échelle : Figure 03 de Figure AI, Optimus Gen 3 de Tesla, pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. L'approche d'Acorn, centrée sur un préhenseur industriel à faible complexité matérielle plutôt que sur une plateforme humanoïde généraliste, repositionne la question de la généralisation robotique au niveau du comportement émergent plutôt que de la capacité de représentation. La startup appartient à une génération de chercheurs sino-américains explorant des alternatives à l'apprentissage supervisé massif, un espace également investigué par des équipes européennes en robotique cognitive, notamment en France et en Suisse. Les prochaines étapes annoncées portent sur l'extension à d'autres scénarios de fabrication flexible, sans calendrier précis communiqué à ce stade.

Chine/AsiePaper
1 source
OASIS : de la collecte de données en simulation à la loco-manipulation humanoïde en conditions réelles
62arXiv cs.RO 

OASIS : de la collecte de données en simulation à la loco-manipulation humanoïde en conditions réelles

Une équipe de chercheurs publie sur arXiv (juin 2026) le framework OASIS, une approche pour entraîner des robots humanoïdes à des tâches de loco-manipulation, combinaison de locomotion et de manipulation d'objets, en s'appuyant exclusivement sur des données de simulation. Le système reconstruit automatiquement des assets 3D réalistes à partir d'images du monde réel via un modèle génératif, puis collecte des trajectoires par télé-opération dans ce simulateur. Ces trajectoires sont ensuite augmentées par randomisation de domaine : variations d'éclairage, de textures et de configuration environnementale. Une politique visuomotrice hiérarchique, entraînée sur ces données simulées, est déployée en zero-shot sur un robot humanoïde physique, sans fine-tuning sur données réelles. Les résultats publiés indiquent que cette politique dépasse, sur la majorité des tâches testées, les performances d'une politique entraînée sur des données de télé-opération réelle. Ce résultat, à prendre avec prudence, le preprint n'étant pas encore soumis à peer review, va à contre-courant d'une hypothèse largement répandue : que la qualité des données terrain serait irremplaçable pour la manipulation fine. Le principal facteur explicatif avancé par les auteurs est la couverture plus large des variations d'éclairage et d'environnement dans le rendu simulé, que la collecte physique peine à égaler à grande échelle. Si le résultat se confirme, il soulage considérablement le goulot d'étranglement de la collecte terrain, qui implique aujourd'hui des resets manuels coûteux et une infrastructure dédiée par tâche. La loco-manipulation reste l'un des défis les plus complexes en robotique humanoïde, car elle exige une coordination simultanée du contrôle de marche et de la manipulation d'objets. Des plateformes comme Figure 03, l'Optimus Gen 3 de Tesla ou l'Atlas de Boston Dynamics cherchent des solutions via des approches diverses : imitation learning sur données réelles (pi-0 de Physical Intelligence), politiques VLA (GR00T N2 de Nvidia) ou RL massivement simulé (Unitree). OASIS positionne la simulation augmentée comme alternative crédible à la télé-opération physique, ce qui pourrait accélérer le bootstrapping de nouvelles tâches sans mobiliser de cellules robotiques dédiées. Les prochaines étapes attendues sont une évaluation sur un spectre plus large de tâches industrielles et une soumission à une conférence avec évaluation par les pairs.

RechercheOpinion
1 source
Une entreprise chinoise va déployer 100 robots humanoïdes dans des foyers pour les tâches quotidiennes
63Interesting Engineering 

Une entreprise chinoise va déployer 100 robots humanoïdes dans des foyers pour les tâches quotidiennes

La société chinoise GigaAI, basée à Wuhan, a déployé un premier lot de 100 robots humanoïdes SeeLight S1 dans des foyers réels, dans ce que l'entreprise présente comme le premier test à grande échelle d'un robot humanoïde polyvalent à usage domestique en Chine. Dans un appartement de démonstration à Wuhan, deux unités ont exécuté une série de tâches documentées fin mai 2026: l'une a préparé un petit-déjeuner (récupération d'aliments, chauffe au micro-ondes, débarrassage des couverts, chargement du lave-vaisselle), l'autre a sorti le linge d'un sèche-linge, plié des vêtements et rangé une armoire. Selon GigaAI, ces séquences ont été apprises en moins d'un mois de formation sur site. Le SeeLight S1 repose sur ce que l'entreprise appelle un "modèle de fondation incarné" (embodied foundation model), capable de traiter des instructions en langage naturel, d'interpréter son environnement visuel, de planifier une action et de l'exécuter de manière autonome, y compris lorsque la disposition des meubles change en cours de route. Ce déploiement illustre le changement de paradigme central dans la course humanoïde: passer de la démonstration contrôlée au test en conditions réelles, là où réside précisément la difficulté. Contrairement aux environnements d'usine, structurés et prévisibles, les foyers sont imprévisibles: meubles déplacés, objets laissés hors de leur place, conditions lumineuses variables, routines différentes d'un foyer à l'autre. Ce phénomène, connu sous le nom de paradoxe de Moravec, explique pourquoi des tâches en apparence simples comme plier du linge ou saisir un objet sans le renverser restent plus difficiles à automatiser que des problèmes mathématiques complexes. Les limites constatées lors du déploiement sont significatives et méritent d'être signalées: organiser quelques livres peut prendre plusieurs minutes, plier un seul vêtement peut dépasser dix minutes, et le robot a eu des difficultés à manipuler des verres contenant des liquides. GigaAI qualifie elle-même ce déploiement de "plateforme de collecte de données" plutôt que de produit fini, une distinction importante pour les intégrateurs et décideurs industriels qui suivent le secteur. GigaAI s'inscrit dans une vague de startups chinoises qui accélèrent sur le segment humanoïde domestique, en concurrence directe avec des acteurs américains comme Figure (Figure 02), Physical Intelligence (Pi-0) ou encore Tesla (Optimus Gen 2), ainsi qu'avec des compétiteurs locaux tels qu'Unitree Robotics (G1) et UBTECH (Walker S). Le co-fondateur et directeur scientifique Zhu Zheng résume l'enjeu technique en opposant "cervelet" (mouvements acrobatiques, équilibre) et "cerveau" (planification, adaptation au contexte), soulignant que c'est cette seconde dimension qui différencie la robotique domestique de la robotique industrielle classique. L'entreprise prévoit de lancer le SeeLight S2 d'ici fin 2026, avec un châssis plus compact, une autonomie de batterie étendue, une portée de bras améliorée et des algorithmes d'IA plus avancés. Le programme de tests devrait également s'élargir à des foyers avec des personnes âgées et des enfants, deux segments particulièrement exigeants pour l'embodied AI et potentiellement les plus porteurs commercialement.

UESignal concurrentiel indirect pour les acteurs européens de la robotique humanoïde : la Chine franchit le cap du déploiement domestique réel avant les occidentaux, ce qui pourrait accélérer la pression sur les roadmaps et financements européens du secteur.

Chine/AsieOpinion
1 source
NVIDIA et LG Group bâtissent une usine d'IA pour développer l'IA physique, la mobilité et l'infrastructure IA
64NVIDIA Blog Robotics 

NVIDIA et LG Group bâtissent une usine d'IA pour développer l'IA physique, la mobilité et l'infrastructure IA

NVIDIA et LG Group ont annoncé la construction d'une infrastructure conjointe qualifiée d'"AI factory", destinée à accélérer les activités du conglomérat coréen dans quatre domaines: la robotique, la conduite autonome, les technologies de centres de données et les services cloud GPU. L'infrastructure couvrira l'intégralité du cycle, de l'entraînement à la simulation et au déploiement, en reliant génération de données, simulation robotique et jumeaux numériques dans un workflow unifié. Du côté robotique, LG Electronics intègre les frameworks NVIDIA Isaac Sim et Isaac Lab dans le développement de CLoiD, son robot domestique conçu pour les tâches d'intérieur, et explore l'adoption du modèle de fondation GR00T, un VLA (vision-language-action model) destiné à lui conférer un raisonnement de type humanoïde. LG Electronics développe également une data factory d'IA physique pour fournir des données d'entraînement aux entreprises coréennes et mondiales, en s'appuyant sur NVIDIA Cosmos pour la génération de données synthétiques. LG Innotek prépare des solutions de capteurs optiques optimisées pour les environnements GPU NVIDIA, tandis que LG CNS intègre Isaac, Cosmos et GR00T dans sa plateforme industrielle PhysicalWorks pour accélérer l'automatisation logistique et manufacturière. Sur le volet infrastructure, les deux groupes approfondissent leur collaboration autour du refroidissement des AI factories, incluant des unités de distribution de refroidissement (CDU), des plaques froides et un design modulaire préfabriqué, le tout aligné sur la plateforme NVIDIA DSX. Ce partenariat illustre la verticalisation des stacks d'IA physique, du modèle de fondation jusqu'au déploiement industriel. LG apporte des données de fabrication issues de sites mondiaux, une expertise optique via Innotek et des capacités d'intégration SI via CNS, là où NVIDIA fournit la couche logicielle et les accélérateurs. L'annonce de la data factory mérite une attention particulière: LG se positionne comme fournisseur de données d'entraînement pour l'industrie robotique, une ressource devenue critique face au défi du sim-to-real. Il convient cependant de souligner que CLoiD et l'intégration GR00T restent au stade de l'exploration déclarée, non d'un produit expédié, et qu'aucune métrique de déploiement industriel ni de volumétrie de production n'est communiquée. Ce rapprochement s'inscrit dans la stratégie NVIDIA d'expansion de l'écosystème Isaac et GR00T auprès des industriels asiatiques, après des partenariats similaires avec Foxconn et Hyundai. LG entre ainsi en compétition directe avec Samsung et SK dans la course des conglomérats coréens à intégrer l'IA physique dans leur portefeuille. Dans le segment des robots de service, CLoiD sera en concurrence indirecte avec Figure 03, Tesla Optimus Gen 3, 1X NEO et Sanctuary AI Phoenix, tous en déploiements pilotes chez des industriels. Côté infrastructure AI factory, Dell, HPE et Lenovo sont également partenaires certifiés NVIDIA DSX, ce qui relativise toute exclusivité de l'accord. Aucune date de livraison ni volume de déploiement n'est précisé dans l'annonce: il s'agit pour l'instant d'un cadre de coopération stratégique, pas d'un contrat de déploiement signé.

Chine/AsieOpinion
1 source
Le robot humanoïde biomimétique pleine taille d'UBTECH dépasse 1 000 précommandes en 3 jours
65Pandaily 

Le robot humanoïde biomimétique pleine taille d'UBTECH dépasse 1 000 précommandes en 3 jours

UBTECH Robotics, coté à Hong Kong et souvent présenté comme "la première action cotée sur le marché des humanoïdes", a lancé en précommande sur JD.com son robot humanoïde biomimétique grand format, enregistrant plus de 1 200 réservations en trois jours. Le robot se décline en deux versions: masculine (183 cm, 42 kg) et féminine (168 cm, 35,2 kg), toutes deux équipées de 88 degrés de liberté (DOF) répartis sur l'ensemble du corps et d'une autonomie batterie de 2 à 4 heures. La précommande requiert un acompte de 3 000 yuans (environ 380 euros), intégralement remboursable avant le 15 juillet. UBTECH n'a pas encore communiqué de prix définitif, mais des analystes sectoriels estiment la fourchette à plusieurs centaines de milliers de yuans, soit le prix d'un véhicule automobile de milieu de gamme en Chine. Les caractéristiques complètes du produit seront dévoilées lors d'un événement de lancement annoncé avant fin juin 2026. Plus de 150 000 internautes rien qu'à Pékin ont visité la page produit dans les trois premiers jours, signe d'un intérêt grand public notable. Sur le plan technique, 88 DOF full-body représente un niveau de granularité cinématique rarement atteint dans un produit à vocation grand public, là où la plupart des humanoïdes industriels actuels tournent entre 30 et 60 DOF. Cela dit, le DOF seul ne dit rien de la qualité des actionneurs, des boucles de contrôle ni de la latence, et UBTECH n'a pas encore publié de données de performance indépendantes. Le positionnement "compagnon émotionnel et assistant domestique", réservé aux utilisateurs adultes, marque un tournant stratégique explicite: après des années centrées sur la robotique éducative et les déploiements B2B, la société mise sur le marché résidentiel, un segment encore sans standard établi. Ce signal de demande (1 200 unités en 72 heures, sans prix final annoncé) intéresse autant les intégrateurs que les décideurs industriels cherchant à calibrer l'appétit réel pour l'humanoïde hors usine. UBTECH existe depuis 2012 et a construit sa notoriété avec Walker X, un humanoïde de démonstration, et des robots pédagogiques déployés dans les écoles chinoises. L'introduction en bourse à Hong Kong lui a conféré une visibilité unique dans un secteur dominé par des startups non cotées. Sur le marché international, les concurrents directs dans la catégorie grand format incluent Figure Robotics (Figure 02), Boston Dynamics (Atlas), Tesla (Optimus Gen 3) et Unitree (H1/G1), tous encore principalement positionnés sur des cas d'usage industriels ou de recherche. En Chine, Fourier Intelligence et Agibot représentent une concurrence locale directe. Les prochaines étapes pour UBTECH passent par la révélation du prix final et les premiers retours sur la tenue réelle des performances biomimétiques annoncées, deux éléments qui conditionneront la crédibilité de ce pivot consommateur.

UESignal de marché indirect : la validation d'une demande consommateur pour l'humanoïde grand public en Chine pourrait accélérer les arbitrages de positionnement des acteurs européens, mais aucun déploiement ni partenariat EU n'est impliqué.

Chine/AsieOpinion
1 source
MotionDisco : découverte de mouvements pour la loco-manipulation extrême des robots humanoïdes
66arXiv cs.RO 

MotionDisco : découverte de mouvements pour la loco-manipulation extrême des robots humanoïdes

Des chercheurs ont publié sur arXiv (réf. 2606.06139, juin 2026) MotionDisco, un cadre méthodologique capable de générer automatiquement des séquences de mouvements corps entier pour robots humanoïdes, sans recourir à la téleopération ni au retargeting de mouvements humains. Le système couple une recherche évolutionnaire guidée par un grand modèle de langage (LLM) sur des séquences d'interactions de contact, un optimiseur de trajectoire cinodynamique séquentiel et une stratégie d'élagage. Les trajectoires ainsi découvertes servent à entraîner des politiques de suivi par apprentissage par renforcement (RL), déployées ensuite sur un robot humanoïde physique dans des tâches de loco-manipulation longue durée. Des études d'ablation documentent que la recherche guidée par LLM produit des trajectoires corps entier cohérentes sur plusieurs tâches à long horizon impliquant des contacts riches avec l'environnement. L'enjeu principal est de contourner la téleopération, aujourd'hui le principal mode d'acquisition de données pour les humanoïdes en manipulation, approche coûteuse et difficile à passer à l'échelle. La difficulté est fondamentalement combinatoire: le nombre d'interactions de contact possibles croît exponentiellement avec l'horizon temporel et le nombre d'objets en scène. En automatisant la découverte de compétences, MotionDisco ouvre une voie potentiellement scalable pour les intégrateurs industriels sans infrastructure de téleopération. Le transfert sim-to-real sur robot physique est démontré, ce qui distingue ce travail de nombreuses contributions demeurant en simulation. Les auteurs revendiquent une première mondiale: la découverte et le déploiement de compétences humanoïdes loco-manipulation longue durée par recherche évolutionnaire entièrement automatisée, une affirmation qui reste à valider indépendamment par la communauté. Ce travail s'inscrit dans un paysage où les principaux acteurs humanoïdes, tels que Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (pi0), Unitree et NVIDIA (GR00T N2), misent massivement sur la téleopération et les démonstrations humaines pour entraîner leurs politiques de manipulation. L'utilisation d'un LLM comme moteur de recherche pour guider l'exploration de contacts s'apparente aux travaux récents sur les VLA (Vision-Language-Action models), mais positionnée en amont comme générateur de curriculum plutôt que comme politique de contrôle direct. Aucun partenaire industriel ni calendrier de déploiement n'est mentionné dans l'article, qui demeure une contribution de recherche fondamentale sans affiliation ou plateforme matérielle spécifiée. Les extensions naturelles porteraient sur des scènes multi-objets plus complexes et la validation sur une gamme élargie de plateformes humanoïdes commerciales.

RecherchePaper
1 source
LadderMan : apprentissage de l'escalade d'échelles par un humanoïde perceptif
67arXiv cs.RO 

LadderMan : apprentissage de l'escalade d'échelles par un humanoïde perceptif

Des chercheurs ont publié le 5 juin 2026 sur arXiv (preprint 2606.05873) un système baptisé LadderMan, conçu pour permettre à des robots humanoïdes de grimper des échelles de géométries variées et d'effectuer des tâches de manipulation en position perchée. L'architecture repose sur un pipeline d'apprentissage en deux étapes : une phase de suivi de mouvement hybride extrait plusieurs politiques d'escalade expertes à partir d'une seule motion de référence, puis une phase de distillation fusionne ces experts en une politique visuomotrice unifiée, pilotée par caméra de profondeur, via une combinaison d'imitation et de renforcement. Pour combler l'écart simulation-réel sur la perception de profondeur, l'équipe exploite des modèles de vision fondationnels. La manipulation en hauteur est gérée par une formulation dite "dual-agent" : un agent dédié à la stabilité sur l'échelle, un autre à la manipulation, avec télé-opération comme signal superviseur. Les expériences rapportent un transfert zéro-shot vers le hardware réel, sans fine-tuning supplémentaire. L'escalade d'échelle constitue l'un des tests les plus discriminants pour les humanoïdes : les points d'appui sont rares et fixes, la coordination corps entier est critique, et la moindre erreur de perception ou de contrôle peut provoquer une chute. Le transfert zéro-shot réussi de la simulation au réel est ici le résultat le plus significatif : il suggère que les modèles de vision fondationnels permettent d'atténuer suffisamment le sim-to-real gap sur des tâches perceptivo-motrices contraintes, une hypothèse longtemps débattue dans la communauté. La capacité à manipuler des objets depuis une position instable ouvre des perspectives concrètes pour l'inspection industrielle, la maintenance en hauteur et les chantiers de construction. Il convient cependant de souligner qu'il s'agit d'un preprint de recherche, non d'un produit commercialisé, et que les vidéos publiées sur ladderman-robot.github.io restent sélectionnées par les auteurs. Ce travail s'inscrit dans une vague active de recherche poussant les humanoïdes vers des environnements contraints et à risque élevé. Aucune entreprise commerciale n'est identifiée dans le preprint, ce qui suggère une origine académique. Sur le plan concurrentiel, aucun constructeur humanoïde majeur, ni Boston Dynamics (Atlas), ni Figure (Figure 03), ni Tesla (Optimus Gen 3), ni Agility Robotics (Digit), n'a à ce jour publié de démonstration d'escalade d'échelle à ce niveau de robustesse et de transfert zéro-shot. Les prochaines étapes logiques seraient un test sur une gamme plus large de robots humanoïdes commerciaux et une intégration de la manipulation autonome, sans télé-opération.

RecherchePaper
1 source
BYD développe secrètement un robot humanoïde sous le nom de code "Yao-Shun-Yu" alors que les géants de l'automobile s'élancent vers l'IA incarnée
68Pandaily 

BYD développe secrètement un robot humanoïde sous le nom de code "Yao-Shun-Yu" alors que les géants de l'automobile s'élancent vers l'IA incarnée

BYD, premier constructeur automobile électrique chinois, confirme le développement discret d'un robot humanoïde sous le nom de code "Yao-Shun-Yu". C'est Li Ke, vice-président exécutif du groupe, qui a levé le voile dans une interview récente. Le projet a été lancé en 2022 et est piloté par la 15e unité opérationnelle de BYD, dédiée à l'intégration électronique et à l'intelligence embarquée. L'entreprise dispose d'une équipe de plus de 4 000 ingénieurs spécialisés en conduite autonome et a annoncé un investissement de 100 milliards de yuans dans l'IA et l'intelligence automobile. Tesla, de son côté, a déjà déployé 50 unités de son Optimus Gen 3 dans son usine de Shanghai en production de série. XPeng prévoit de lancer la production de masse de son humanoïde IRON d'ici fin 2026, et Li Auto pilote un projet interne baptisé Nexus. Ce développement illustre un changement structurel dans la course aux humanoïdes : les grands constructeurs automobiles ne se positionnent plus comme observateurs mais comme acteurs à part entière de la robotique généraliste. BYD s'appuie sur des atouts industriels concrets, motorisation, batteries, électronique de puissance, fabrication de précision et semiconducteurs, que peu de pure players robotiques peuvent revendiquer. L'entreprise prévoit d'être son propre premier client, avec des déploiements envisagés dans ses showrooms comme agents d'accueil et sur ses lignes de production comme opérateurs d'atelier. Ce débouché captif résout un problème que la majorité des startups humanoïdes n'ont pas encore résolu : la validation à l'échelle dans un environnement contrôlé et à faible coût de sortie. La stratégie dite du "technology fish pond", qui consiste à préparer en amont un portefeuille technologique large et à l'activer au moment opportun, laisse également envisager une approche plateforme ouverte, avec intégration de composants tiers plutôt qu'une verticalité totale. BYD n'est pas venu à la robotique par hasard. La maîtrise des actionneurs électriques, des systèmes de gestion d'énergie et des architectures de calcul embarqué, accumulée sur des millions de véhicules électriques, constitue une base technologique directement transférable. Li Ke a formulé le diagnostic sectoriel en ces termes : "les robots chinois manquent de cerveau, les robots américains manquent de muscles", BYD visant explicitement l'excellence sur les deux axes. Face à Boston Dynamics (propriété de Hyundai), Agility Robotics (Amazon), Figure AI ou Physical Intelligence côté occidental, et à Unitree, Fourier Intelligence ou UBTECH côté chinois, BYD arrive avec une surface financière et une base industrielle hors norme. Aucune date de présentation publique ni de feuille de route commerciale n'a été communiquée : le projet reste pour l'instant au stade de l'annonce interne, sans prototype démontré publiquement ni métrique de performance vérifiable.

Chine/AsieOpinion
1 source
IA incarnée chinoise : une entreprise domine le benchmark RoboArena, devant NVIDIA et Physical Intelligence
69Pandaily 

IA incarnée chinoise : une entreprise domine le benchmark RoboArena, devant NVIDIA et Physical Intelligence

Une entreprise chinoise spécialisée en intelligence artificielle incarnée (embodied AI) a décroché la première place du classement RoboArena lors de la conférence NVIDIA GTC Taipei 2026, devançant NVIDIA et Physical Intelligence (PI). Le benchmark RoboArena est conçu pour évaluer des systèmes d'IA robotique sur des tâches physiques réelles variées : manipulation d'objets, navigation mobile et utilisation d'outils complexes. Sa méthodologie inclut des conditions environnementales aléatoires, des perturbations adversariales et des exigences strictes de reproductibilité, ce qui en fait l'un des rares benchmarks difficiles à truquer par overfitting. Fait notable : l'article source ne mentionne pas le nom de cette entreprise, ce qui affaiblit la portée de l'annonce et rend toute vérification indépendante impossible pour l'instant. La solution retenue s'appuie sur une architecture qui intègre étroitement la perception visuelle et le contrôle moteur au niveau du réseau de neurones, permettant une adaptation rapide à de nouveaux environnements avec un fine-tuning minimal. L'entrée de NVIDIA, construite sur sa plateforme Isaac et ses pipelines de simulation-to-real accélérés GPU, ainsi que celle de Physical Intelligence, connue pour ses politiques robotiques généralistes (dont le modèle Pi-0), ont toutes deux été surpassées en score agrégé. Ce résultat conteste l'hypothèse dominante selon laquelle la puissance de calcul brute est le principal levier de performance en embodied AI. Si confirmé, cela suggère que l'innovation architecturale et une utilisation efficace des données réelles peuvent compenser un désavantage de ressources significatif face à des acteurs comme NVIDIA ou PI, qui disposent de budgets compute sans commune mesure. Pour les intégrateurs et décideurs industriels, cela signifie que le marché reste ouvert à des challengers lean, et que la course à la généralisation robotique n'est pas encore jouée par les seuls hyperscalers. La validation par un benchmark tiers réputé représente un argument commercial fort, surtout dans un secteur où les démonstrations en conditions contrôlées sont légion. Il convient cependant de rester prudent : aucune métrique précise (payload, degrés de liberté, temps de cycle, taux de succès par tâche) n'est communiquée dans l'annonce, et les vidéos de démonstration n'ont pas encore été soumises à un audit indépendant. RoboArena a été lancé comme réponse directe aux critiques sur la reproductibilité des benchmarks robotiques, dans un contexte où des acteurs comme Figure AI (Figure 03), Tesla (Optimus Gen 3), Boston Dynamics, 1X Technologies et Physical Intelligence publient des résultats difficiles à comparer. La Chine construit depuis plusieurs années un écosystème embodied AI dense, porté par une base de fabrication hardware mature, un vivier de talents en vision par ordinateur issus des géants technologiques (Baidu, Alibaba, DJI), et un soutien gouvernemental actif à l'industrialisation de l'IA. La prochaine étape logique pour cette entreprise anonyme sera de se nommer publiquement, de publier ses données brutes et d'annoncer des déploiements pilotes en environnement industriel réel pour confirmer que la performance benchmark se traduit en valeur opérationnelle.

UELa compétitivité croissante de l'écosystème chinois en IA incarnée constitue un signal d'alerte indirect pour les industriels et laboratoires européens positionnés sur la robotique généraliste.

Chine/AsieOpinion
1 source
Un fabricant shanghaïen dévoile un robot humanoïde de 1,2 m à double cerveau et design compact
70Interesting Engineering 

Un fabricant shanghaïen dévoile un robot humanoïde de 1,2 m à double cerveau et design compact

JAKA Robotics, société shanghaïenne fondée en 2015 et jusqu'ici connue pour ses cobots industriels, a dévoilé le Pi, un robot humanoïde compact mesurant 1,22 mètre pour 42 kilogrammes. La plateforme intègre 27 degrés de liberté grâce à des modules articulaires intégrés de nouvelle génération, annoncés 15 à 27 % plus compacts que la génération précédente. Les genoux développent jusqu'à 120 Nm de couple pour la locomotion, et chaque bras supporte une charge utile de 3 kilogrammes. L'architecture de contrôle repose sur une plateforme Intel hétérogène à double domaine : un "cerveau" chargé du raisonnement IA, de la perception visuelle, des grands modèles de langage et de la logique applicative, et un "cervelet" dédié au contrôle moteur temps réel via un réseau EtherCAT à latence milliseconde. JAKA présente le Pi comme une plateforme de R&D pour l'intelligence incarnée et l'interaction homme-robot, sans annoncer de déploiement commercial ni de calendrier de production. La principale valeur technique du Pi réside dans son architecture duale, qui sépare explicitement l'inférence IA du contrôle déterministe -- une approche que l'on retrouve chez plusieurs concurrents mais que JAKA documente ici avec des métriques d'intégration concrètes. Pour un intégrateur ou un décideur industriel, la compacité (42 kg, 1,22 m) et le payload de 3 kg par bras positionnent le Pi sur un segment intermédiaire entre les humanoïdes de taille adulte comme Figure 03 ou Tesla Optimus Gen 3 et les plateformes de table. En revanche, les performances annoncées restent à ce stade des spécifications constructeur: aucune vidéo de tâche en conditions réelles n'a été publiée, et la notion de "polyvalence applicative" n'est étayée par aucun benchmark reproductible ni site pilote identifié. JAKA s'est construit sur dix ans une gamme cobot industrielle étendue -- séries Zu (3 à 30 kg), Pro (IP68, milieux hostiles), S Series (contrôle en force), AL/A Series (vision intégrée) -- avant d'amorcer un pivot vers l'intelligence incarnée avec ses humanoïdes K1, K1L et K1W. Le Pi s'inscrit dans cette trajectoire de montée en gamme vers des systèmes IA embarqués. Sur le plan concurrentiel, le marché humanoïde compact est déjà occupé par Unitree (G1, 1,27 m, 35 kg), Agility Robotics (Digit), et côté recherche par des plateformes comme le PR2 ou l'Atlas de Boston Dynamics. En Chine, des acteurs comme Fourier Intelligence ou UBTech développent également des humanoïdes à vocation industrielle. La Chine déploie par ailleurs des robots humanoïdes dans la logistique postale, notamment à Guangzhou, signal d'un marché domestique qui commence à absorber ces systèmes. JAKA n'a pas communiqué de prix, ni de partenaires industriels, ni de calendrier pour des pilotes commerciaux du Pi.

HumanoïdesOpinion
1 source
Astribot atteint la valorisation d'un milliard de dollars après la clôture rapide de sa série B
71Pandaily 

Astribot atteint la valorisation d'un milliard de dollars après la clôture rapide de sa série B

Astribot, startup d'IA incarnée basée à Shenzhen, vient d'atteindre le statut de licorne en bouclant une série B qui porte sa valorisation au-delà de 10 milliards de RMB (environ 1,4 milliard de dollars). La société a enchaîné trois tours de financement consécutifs en l'espace de trois mois, levant au total plus d'un milliard de RMB. Le 27 mai 2026, elle a dévoilé son nouveau robot humanoïde T1 : 1,55 mètre de hauteur, 66 kilogrammes, 23 degrés de liberté et un payload de 5 kilogrammes par bras. L'architecture repose sur un actionnement par câbles, à la différence des solutions à engrenages ou hydrauliques des concurrents, ce qui procure des mouvements plus fluides et des marges de sécurité plus élevées pour une cohabitation avec des opérateurs humains. Fin 2025, Astribot annonçait des livraisons à l'échelle de plusieurs milliers d'unités, un chiffre à interpréter avec prudence puisqu'aucune donnée vérifiable de production n'a été communiquée. Le tour de table mêle des récurrents comme Ant Group à de nouveaux entrants : Thundersoft, spécialiste des systèmes embarqués pour cockpits automobiles, et Kede Education, ainsi que plusieurs fonds régionaux. Ce financement intervient alors que la plupart des acteurs du marché des humanoïdes restent en phase de prototype ou de pilote limité. La revendication d'Astribot d'être le seul fabricant en série mondiale de robots à câbles relève du discours marketing, mais l'existence de livraisons plurimilliers dès fin 2025 constitue un signal industriel tangible dans un secteur où le fossé entre démonstration et déploiement réel reste la principale ligne de fracture. Le partenariat avec Thundersoft cible l'intégration dans des cockpits automobiles intelligents, ouvrant un débouché B2B au-delà des seuls environnements manufacturiers. Côté fondation technique, le modèle Lumo joue le rôle de VLA (vision-language-action model), couplé à un OS robotique propriétaire : une pile verticalement intégrée qui, si elle tient ses promesses de sim-to-real, pourrait réduire les délais de déploiement chez les intégrateurs industriels. Astribot a été fondée en décembre 2022 par Lai Jie, vétéran de dix-sept ans en robotique, premier employé du laboratoire RoboticsX de Tencent (où il a conçu le robot à roues-jambes Ollie) et ancien responsable de l'équipe Xiaodu Robot chez Baidu. La montée en valorisation en moins de trois ans reflète à la fois la maturité de la chaîne d'approvisionnement robotique chinoise et un appétit investisseur en forte accélération pour l'IA incarnée. Sur le marché mondial, Astribot se retrouve en compétition directe avec Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (pi0) et NVIDIA (GR00T N2), ainsi qu'avec des acteurs chinois comme Unitree et Fourier Intelligence. Les prochaines étapes annoncées comprennent l'ouverture d'un centre d'IA incarnée à Yangzhou en partenariat avec les autorités municipales, et des programmes de formation professionnelle pour alimenter l'écosystème en techniciens spécialisés.

Chine/AsieOpinion
1 source
Human2Humanoid : transfert de mouvement multi-morphologie assisté par la physique pour robots humanoïdes
72arXiv cs.RO 

Human2Humanoid : transfert de mouvement multi-morphologie assisté par la physique pour robots humanoïdes

Une équipe de recherche a publié le 3 juin 2026 sur arXiv (référence 2606.03476) un framework baptisé Human2Humanoid, conçu pour transférer automatiquement des mouvements humains vers des robots humanoïdes sans nécessiter de données d'entraînement appariées. La méthode, entièrement non supervisée, a été validée sur le robot Unitree G1, un humanoïde à 23 degrés de liberté commercialisé par la société chinoise Unitree Robotics. L'architecture repose sur un réseau adversarial de type CycleGAN couplé à un réseau de convolution sur graphes sensible à la topologie squelettique, permettant de capturer les caractéristiques motrices dépendantes de la structure anatomique. Pour compenser les écarts de proportions entre morphologies humaine et robotique, les auteurs introduisent une fonction de perte dite "morphology-invariant end-effector consistency" qui aligne les trajectoires normalisées des effecteurs terminaux (mains et pieds) afin de préserver la sémantique du mouvement d'un corps à l'autre. Des contraintes de faisabilité physique explicites sont également imposées pour reproduire les patterns de contact de la séquence source et limiter les artefacts cinématiques. Ce travail s'attaque à un goulot d'étranglement majeur du secteur humanoïde : le retargeting de mouvement est fondamental pour le télé-opération, l'apprentissage par imitation et l'interaction homme-robot, mais les approches supervisées exigent des corpus de données appariées humain-robot quasi inexistants à grande échelle. En supprimant cette contrainte, Human2Humanoid ouvre la voie à l'exploitation de bibliothèques de capture de mouvement (mocap) existantes sans phase de labellisation. Les résultats expérimentaux indiquent que la méthode surpasse les approches concurrentes sur deux critères clés : contrôlabilité en aval (la politique apprise est plus exploitable pour des tâches réelles) et faisabilité physique (moins de violations de contraintes, meilleure reproductibilité des contacts). C'est un signal positif dans un contexte où le fossé démo-réalité reste la critique récurrente du secteur. Le retargeting de mouvement humain vers robot est un champ de recherche actif depuis plusieurs années, alimenté par la course aux humanoïdes commerciaux. Unitree, positionné comme fournisseur de plateformes matérielles accessibles face à Boston Dynamics, Figure AI (modèle Figure 03), Tesla (Optimus Gen 3) ou Agility Robotics, bénéficie directement de ce type de contribution académique qui enrichit l'écosystème logiciel autour de son G1. Du côté des méthodes concurrentes, on trouve notamment des approches à base de réseaux de retargeting supervisés ou de politiques d'imitation directe comme pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA). Human2Humanoid n'est pas encore un produit déployé : c'est une contribution de recherche fondamentale, sans annonce de pilote industriel associée. Les prochaines étapes naturelles seraient une validation sur d'autres plateformes humanoïdes et une intégration dans des pipelines d'apprentissage par renforcement ou d'imitation à grande échelle.

IA physiquePaper
1 source
Dyno, le premier robot humanoïde du Vietnam, cible la sécurité et les tâches domestiques
73Interesting Engineering 

Dyno, le premier robot humanoïde du Vietnam, cible la sécurité et les tâches domestiques

VinDynamics, filiale robotique du conglomérat vietnamien Vingroup (connu pour VinFast dans l'automobile et VinAI dans l'intelligence artificielle), a présenté Dyno lors de l'ICRA 2026 à Vienne et du Computex Taipei 2026, marquant l'entrée officielle du Vietnam dans la course aux humanoïdes. Le robot est conçu pour deux segments initiaux: la sécurité et la surveillance dans les espaces urbains et commerciaux, et l'assistance domestique. Un déploiement pilote a déjà eu lieu à Vinpearl Safari Phu Quoc, en conditions extérieures, où Dyno a opéré comme guide multilingue autonome, capable d'interaction en langage naturel et de perception environnementale en temps réel. Sur le plan des composants, VinDynamics expose également l'actionneur VDM 80, un joint compact de moins d'un kilogramme, tournant jusqu'à 235 rpm sous 48V, compatible CAN FD, RS485 et EtherCAT, avec une durée de vie annoncée supérieure à 10 000 heures. La main robotique associée intègre 11 articulations mobiles et 6 degrés de liberté activement contrôlés, avec capteurs de force intégrés. Les spécifications globales du robot (payload, nombre total de DOF, autonomie énergétique) n'ont pas encore été publiées. Ce lancement positionne VinDynamics comme le premier acteur sud-est-asiatique à entrer publiquement dans le segment humanoïde full-body, dans un marché jusqu'ici dominé par des entreprises américaines et chinoises. La stratégie modulaire est notable: en exposant séparément l'actionneur, la main et la plateforme d'entraînement IA, l'entreprise signale une ambition B2B de fournisseur de composants en plus du robot complet, une approche similaire à celle adoptée par des acteurs comme Robosense ou Fourier Intelligence. Le déploiement à Vinpearl constitue une preuve d'exploitation réelle en environnement non contrôlé, ce qui le distingue d'une simple démonstration de laboratoire. Cela dit, l'absence de métriques précises sur les performances du robot principal (vitesse de marche, charge utile, taux de succès sur les tâches de manipulation) rend difficile toute comparaison directe avec les plateformes concurrentes. Dyno reste à ce stade une annonce structurée autour d'un pilote et d'une roadmap de composants, pas encore un produit commercialement disponible. Vingroup est l'un des plus grands conglomérats privés d'Asie du Sud-Est, avec des investissements massifs en R&D technologique depuis 2019 via VinAI Research. VinDynamics s'inscrit dans cette diversification vers la robotique physique. Sur le marché humanoïde global, les concurrents directs incluent Figure (Figure 02 déployé chez BMW), Tesla (Optimus Gen 3 en production), Boston Dynamics (Atlas en phase commerciale), Agility Robotics (Digit chez Amazon), ainsi que les acteurs chinois Unitree, Fourier et AgiBot. La présentation à l'ICRA 2026 est une démarche de légitimation académique et industrielle internationale. Les prochaines étapes annoncées incluent des déploiements commerciaux supplémentaires, sans calendrier précis communiqué.

Chine/AsieOpinion
1 source
Raisonnement continu pour les modèles vision-langage-action (VLA)
74arXiv cs.RO 

Raisonnement continu pour les modèles vision-langage-action (VLA)

Des chercheurs ont publié sur arXiv (2606.00229) une architecture appelée Continuous Reasoning for VLA, qui remplace le langage naturel comme médium de raisonnement pour les politiques robotiques par un espace latent gaussien continu. Le problème est fondamental : le texte opère à la granularité d'une tâche entière, tandis qu'une politique VLA (Vision-Language-Action) doit sélectionner des actions à une échelle temporelle bien plus fine. Le modèle génère d'abord un ensemble structuré de "pensées continues" sous forme de vecteurs gaussiens, puis les réutilise comme contexte partagé pour la génération d'actions par chunks. L'entraînement repose sur un objectif de vérification croisée : un teacher EMA (exponential moving average) doit consommer le raisonnement du modèle étudiant pour prédire les actions cibles, forçant le latent à rester transférable et vérifiable entre instances. Sur robots réels, l'architecture améliore le taux de succès moyen par sous-tâche de 40,4 % sur TX-G2 (variante compatible AgiBot G2) et de 26,3 % sur HSR (Human Support Robot de Toyota), comparé à π0.5 de Physical Intelligence. Ces résultats contredisent une hypothèse répandue : ajouter des tokens de raisonnement textuel via chain-of-thought ou sous-objectifs explicites améliore le contrôle robotique. Les auteurs montrent que ce raisonnement textuel devient facilement un raccourci interne au modèle, efficace sur les comportements vus en entraînement mais peu généralisable. Un médium de raisonnement utile doit être partageable entre instances de modèle et vérifiable via l'amélioration du contrôle aval, deux propriétés que le texte satisfait mal à l'échelle de l'action. La comparaison directe avec π0.5 positionne ce travail en réponse à Physical Intelligence, acteur de référence dans l'espace VLA. Les plateformes testées (AgiBot G2 et HSR) couvrent la robotique de service et industrielle légère, pas uniquement les humanoïdes à fort investissement comme Figure 03 ou Optimus Gen 3. D'autres architectures concurrentes, dont GR00T N2 de NVIDIA et Helix de Figure AI, misent sur des représentations latentes pour améliorer le transfert sim-to-real, mais restent davantage orientées production que recherche fondamentale. Il s'agit pour l'instant d'un résultat académique, sans annonce de pilote commercial ni de déploiement industriel.

RechercheOpinion
1 source
PHASOR : représentations d'actions universelles ancrées en phase pour les humanoïdes
75arXiv cs.RO 

PHASOR : représentations d'actions universelles ancrées en phase pour les humanoïdes

Une équipe de chercheurs a publié sur arXiv (2606.01851) PHASOR, un cadre de représentation d'actions conçu pour l'apprentissage de politiques sur robots humanoïdes. Le problème ciblé est fondamental : les méthodes actuelles produisent des espaces latents opaques, non structurés et liés à une plateforme spécifique. PHASOR exploite la périodicité intrinsèque du mouvement en le factorisant en deux composantes : un manifold de phase capturant les structures cycliques via des coefficients FFT (transformée de Fourier rapide), et une branche de pose conditionnant ce manifold sur les configurations non périodiques. Combiné à une distillation de sémantique de mouvement, le système produit un espace de représentations agnostique à l'embodiment, pré-entraîné sur des données de mouvement humain et transférable à plusieurs plateformes humanoïdes de morphologies différentes. L'enjeu industriel est direct. Les architectures actuelles obligent à ré-entraîner les politiques à chaque changement de plateforme matérielle, un coût élevé pour les intégrateurs gérant des flottes hétérogènes. PHASOR traite l'espace d'embedding d'actions comme un objet de conception à part entière : la qualité de la politique émerge de la qualité de la représentation. Les résultats publiés montrent des gains cohérents sur les tâches robotiques en aval et une forte capacité de récupération cross-embodiment, c'est-à-dire qu'un mouvement appris sur un robot peut être retrouvé et transféré à un autre. Il s'agit toutefois d'un preprint sans revue par les pairs, ce qui invite à rester prudent sur la portée des benchmarks présentés. La question du transfert inter-embodiment est au coeur de la compétition humanoïde. Figure AI (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (pi0), NVIDIA (GR00T N2) et Agility Robotics développent chacun des architectures de politiques rarement compatibles entre elles. Des travaux comme RT-2 ou OpenVLA avaient montré l'utilité du pré-entraînement sur données humaines pour la vision et le langage, mais l'espace d'actions restait un angle mort. PHASOR s'attaque directement à ce manque. Les prochaines étapes naturelles passeraient par une validation sur plateformes physiques, Unitree H1/H2 ou Apollo d'Apptronik en tête, et une confrontation avec des benchmarks standardisés comme HumanoidBench.

IA physiquePaper
1 source
ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU
76arXiv cs.RO 

ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU

Une équipe de chercheurs présente ScheduleStream (arXiv:2511.04758v2), un cadre généraliste de planification et d'ordonnancement pour robots bi-manuels et humanoïdes, conçu pour coordonner plusieurs bras en parallèle. Contrairement aux algorithmes TAMP (Task and Motion Planning) classiques, qui produisent des plans séquentiels où un seul bras se déplace à la fois, ScheduleStream modélise la dynamique temporelle via des hybrid durative actions, des actions pouvant démarrer de façon asynchrone et persister pendant une durée fonction de leurs paramètres. Cette architecture permet d'orchestrer des mouvements simultanés sur plusieurs membres, réduisant le temps de cycle global. Le système intègre une accélération GPU au sein même des échantillonneurs de trajectoires (samplers), et repose sur des algorithmes indépendants du domaine d'application. Les auteurs le valident en simulation ainsi que sur plusieurs tâches bi-manuelles réelles, dont les démonstrations sont accessibles sur schedulestream.github.io. Aucun chiffre précis de gain de temps ni de configuration matérielle (DOF, payload) n'est fourni dans l'abstract : des éléments à vérifier dans le papier complet. Le verrou adressé est structurel : l'espace d'action hybride discret-continu d'un robot multi-bras croît de façon combinatoire, rendant la planification computationnellement prohibitive dès qu'on autorise le parallélisme. En produisant des schedules plutôt que de simples séquences, ScheduleStream ouvre la voie à des cellules robotiques capables d'exécuter des sous-tâches simultanément, saisie d'un côté et assemblage de l'autre, ce qui est précisément le cas d'usage clé pour les intégrateurs cherchant à justifier un humanoïde bi-manuel (Figure 03, Optimus Gen 3, Atlas) en environnement industriel. L'accélération GPU dans le sampler est notable dans un domaine historiquement dominé par des planificateurs CPU-bound, et suggère une voie vers des temps de planification compatibles avec des cadences réelles. Le champ TAMP multi-bras s'est structuré autour de travaux comme PDDLStream (Garrett et al., MIT CSAIL), qui a introduit l'échantillonnage continu dans TAMP, mais sans gestion native du parallélisme temporel. ScheduleStream prolonge cette lignée en ajoutant la dimension asynchrone, un problème traité par ailleurs dans la communauté PDDL+ via des planificateurs temporels comme OPTIC ou POPF. Sur le terrain applicatif, les approches concurrentes incluent les politiques d'imitation comme ACT ou Diffusion Policy, qui contournent la planification symbolique au prix d'une moindre généralisabilité, et des frameworks comme MoveIt Task Constructor sous ROS2. La prochaine étape naturelle serait une validation sur des cellules de production réelles avec des métriques de cycle time documentées, ainsi qu'une publication du code source, non encore disponible à la date d'annonce.

RecherchePaper
1 source
Entreprise chinoise dévoile un robot humanoïde compact avec 42 degrés de liberté et 100 TOPS de puissance de calcul
77Interesting Engineering 

Entreprise chinoise dévoile un robot humanoïde compact avec 42 degrés de liberté et 100 TOPS de puissance de calcul

KEENON Robotics, entreprise shanghaïenne spécialisée dans les robots de service autonomes, a officiellement lancé le XMAN-L1, un robot humanoïde compact destiné aux environnements d'accueil et d'interaction commerciale. Mesurant 136 cm pour un gabarit délibérément contenu, l'XMAN-L1 embarque 42 degrés de liberté biomimétiques, un couple de genou de 132 Nm, une puissance supérieure à 2 000 W par jambe, et une capacité de calcul embarqué de 100 TOPS en inférence locale. Pour la couche conversationnelle, KEENON a intégré les LLMs de Doubao (ByteDance) et de Tencent, permettant un dialogue en langage naturel sans connexion cloud obligatoire. La société annonce le robot comme commercialement disponible immédiatement, avec des cas d'usage ciblés : réception de visiteurs, guidage, animation interactive et présence en espace public. Aucun prix public n'a été communiqué à ce stade. Ce lancement illustre une tendance de fond dans l'industrie robotique chinoise : intégrer des spécifications techniques auparavant réservées aux plateformes de recherche dans des formats de service compacts et déployables à grande échelle. Les 100 TOPS de computing edge sont un signal clair -- le robot est conçu pour fonctionner de manière autonome dans des environnements bruités sans dépendre d'une infrastructure cloud latente, ce qui est un prérequis réel pour l'hôtellerie et le retail. L'intégration native de deux LLMs chinois (Doubao et Tencent) plutôt qu'une API générique constitue un choix de souveraineté technologique cohérent avec le marché domestique visé. Il faut cependant noter que les métriques de mobilité annoncées -- couple et puissance -- ne sont pas accompagnées de données de cycle ou de tests en charge réelle, une réserve habituelle sur ce type d'annonce de lancement. KEENON est historiquement l'un des leaders mondiaux du robot de livraison indoor, avec des gammes bien établies : DINERBOT pour la restauration, BUTLERBOT pour l'hôtellerie, et la série T pour la logistique industrielle. L'XMAN-L1 s'inscrit dans sa série humanoïde XMAN, aux côtés de l'XMAN-R1 (recherche et collaboration homme-robot) et de l'XMAN-F1 (déploiement commercial en réception). Sur le marché humanoïde de service à format compact, KEENON se positionne face à des acteurs comme Enchanted Tools (France, robot Miroki), Unitree (H1/G1) ou encore Fourier Intelligence, tous engagés sur des niches similaires. Les plateformes à vocation industrielle lourde -- Figure 03, Optimus Gen 3, Atlas -- ne ciblent pas encore ce segment. Pour les intégrateurs B2B en hôtellerie ou retail, l'XMAN-L1 représente une option à surveiller, à condition que KEENON publie des données de fiabilité terrain dans les prochains mois de déploiement.

UELe lancement du XMAN-L1 renforce la pression concurrentielle sur Enchanted Tools (France, robot Miroki) dans le segment des humanoïdes de service compact pour l'hôtellerie et le retail.

Chine/AsieOpinion
1 source
Atlas apprend des compétences de football en regardant des images de Coupe du monde
78Interesting Engineering 

Atlas apprend des compétences de football en regardant des images de Coupe du monde

À quelques semaines de la Coupe du Monde 2026, Boston Dynamics a publié une vidéo montrant son robot humanoïde Atlas observer des séquences de matchs passés diffusées sur un grand écran, puis reproduire les gestes des joueurs dans une zone d'entraînement adjacente. Dans les séquences présentées, Atlas déplace son centre de gravité, balance la jambe vers l'avant et guide un ballon au sol avec un contact contrôlé. Le robot enchaîne ensuite une série d'exercices inspirés du football -- passes, pivots, contrôles de balle -- conçus pour travailler l'équilibre, la coordination et le timing des mouvements. La vidéo montre également Atlas lever les bras en signe de célébration après un exercice réussi, puis s'agenouiller pour simuler la réaction à une blessure sur le terrain, des gestes que Hyundai, maison mère de Boston Dynamics, présente comme copiés directement depuis les images de match visionnées. La société a baptisé l'initiative "School of Football" et évoque l'intention de déployer Atlas et le robot quadrupède Spot lors du Mondial 2026, sans préciser leur rôle exact. Cette démonstration s'inscrit dans une séquence de communications rapprochées destinées à montrer qu'Atlas peut acquérir des comportements moteurs complexes sans programmation mouvement-par-mouvement. Techniquement, le pipeline ne repose pas sur une "observation" au sens perceptif : Atlas est entraîné par reinforcement learning en simulation massivement parallèle sur GPU, à partir de trajectoires de référence issues d'animations ou de démonstrations téléopérées. Le robot accumule ce que Boston Dynamics décrit comme des millions d'heures de pratique simulée, en apprenant à maintenir équilibre et prise pendant que des perturbations externes sont introduites. Ce qui distingue Atlas des systèmes vision-only est son recours à la proprioception -- perception interne de la position du corps, de la charge et de l'équilibre -- pour s'adapter en temps réel à des objets instables, comme l'avait illustré une démonstration récente où le robot portait un réfrigérateur de 45 kg tout en conservant l'équilibre. Ces résultats indiquent une progression réelle vers des comportements adaptatifs, même si les conditions des démonstrations restent soigneusement sélectionnées et contrôlées. Boston Dynamics, fondée en 1992 au MIT et rachetée par Hyundai en 2021, a dévoilé la version entièrement électrique d'Atlas en avril 2024, après avoir mis fin au modèle hydraulique. La filiale positionne désormais Atlas comme un "outil polyvalent pour le travail physique", ciblant explicitement les usines, entrepôts et chantiers plutôt que les démonstrations spectaculaires. Dans la course aux humanoïdes industriels, elle fait face à des concurrents directs : Figure AI avec le Figure 03, Tesla avec l'Optimus Gen 3, Physical Intelligence avec Pi-0, NVIDIA avec GR00T N2, et Agility Robotics avec Digit. L'initiative "School of Football" et l'association au Mondial 2026 ressemblent davantage à une opération de visibilité grand public qu'à une annonce produit structurée -- aucun déploiement commercial, aucun partenaire client, aucune timeline n'ont été communiqués. Les jalons à surveiller restent les annonces de pilotes industriels, l'évolution du partenariat avec Hyundai sur les chaînes de fabrication automobile, et la publication éventuelle de métriques de performance en conditions réelles.

HumanoïdesOpinion
1 source
Les humanoïdes apprennent à lire les situations
79Robotics Business Review 

Les humanoïdes apprennent à lire les situations

Concevoir un robot humanoïde capable d'opérer en sécurité aux côtés d'humains mobilise aujourd'hui une chaîne complète de technologies de perception en temps réel. Analog Devices Inc. (ADI) détaille dans un article technique les briques nécessaires à cette conscience situationnelle, porté par Geir Ostrem, Fellow ADI au sein de l'unité Automotive. Le défi central est architectural : capteurs visuels et microphones sont physiquement éloignés du processeur principal, ce qui introduit de la latence sur des câbles longs. Pour y répondre, ADI adapte sa technologie GMSL (Gigabit Multimedia Serial Link), déjà standardisée en automobile, aux châssis humanoïdes. GMSL transporte de la vidéo en flux unique à plusieurs gigabits par seconde, permettant un traitement local embarqué (via ce qu'ADI appelle "physical AI") plutôt qu'un renvoi vers le cloud. Sur la partie vision, les méthodes évoquées sont connues : capteurs RGB, time-of-flight, lumière structurée et stéréovision pour la profondeur. Sur la partie audio, la problématique est similaire : il faut une latence déterministe entre les microphones et l'ordinateur central pour localiser et identifier des événements sonores, par exemple un objet qui tombe derrière le robot. Des processeurs secondaires, positionnés au plus près des capteurs ou des actionneurs, gèrent les boucles de contrôle rapides et transmettent en parallèle au processeur principal. Ce que cette publication illustre concrètement, c'est le déplacement du centre de gravité technologique dans la robotique humanoïde : la mécanique et les modèles de mouvement ne suffisent plus, c'est la couche de perception embarquée qui devient le facteur limitant pour un déploiement en environnement mixte. La latence n'est pas un détail d'ingénierie, c'est une contrainte de sécurité. Un humanoïde qui réagit avec 200 ms de délai à un collègue qui change de trajectoire n'est pas exploitable en production. Le passage au traitement local, sans dépendance réseau, est donc moins un choix de performance qu'une nécessité opérationnelle, surtout dans des ateliers ou entrepôts où la connectivité peut être dégradée. L'article confirme ce que les intégrateurs industriels observent terrain : les architectures distribuées, avec des processeurs locaux près des actionneurs, deviennent le standard de facto pour les boucles de contrôle à haute fréquence. ADI arrive dans la robotique humanoïde depuis l'automobile, où GMSL équipe déjà les systèmes ADAS de nombreux constructeurs. Ce repositionnement sectoriel est cohérent avec la dynamique du marché : la pénurie de main-d'oeuvre pousse à l'accélération des déploiements en espaces partagés, et les fabricants d'humanoïdes, de Figure à Tesla Optimus en passant par Agility Robotics ou 1X Technologies, ont tous besoin de sous-systèmes de perception matures et validés industriellement. À noter que cet article est un contenu sponsorisé signé ADI, ce qui tempère son caractère neutre : les métriques citées (débit GMSL, latence) sont présentées sans benchmark comparatif ni conditions de test précisées. Les prochaines étapes probables pour ADI consistent à nouer des partenariats OEM directs avec des constructeurs d'humanoïdes, une dynamique déjà visible chez des fournisseurs de composants comme NVIDIA (plateforme Thor/Jetson) ou Bosch, qui ciblent eux aussi ce segment en pleine structuration.

InfrastructureActu
1 source
Vidéo : ce robot humanoïde chinois à 42 000 $ associe mouvement en temps réel, vision et contrôle intelligent
80Interesting Engineering 

Vidéo : ce robot humanoïde chinois à 42 000 $ associe mouvement en temps réel, vision et contrôle intelligent

LimX Dynamics, société chinoise de robotique fondée à Shenzhen, a présenté publiquement pour la première fois son humanoïde Luna lors du Taobao Influencer Festival en mars 2026, marquant selon l'entreprise la première démonstration publique mondiale de cette plateforme. Luna mesure 160 cm, dispose de 27 degrés de liberté et embarque le moteur de mouvement propriétaire Sys 0 de deuxième génération, couplé à des moteurs articulaires redessinés. L'engin est taillé pour des performances dynamiques à corps entier : danse, gymnastique, défilé. Sur le plan thermique, LimX annonce une réduction de 30 % de la température de surface des articulations en opération prolongée, et une autonomie batterie améliorée de 150 %. Le tout est proposé à 298 000 RMB, soit environ 41 000 dollars. À ce prix, Luna n'est pas positionnée comme robot industriel de manutention, mais comme plateforme d'interaction en environnement public. Elle intègre également un éditeur de tâches en langage naturel et une fonction video-to-motion permettant de répliquer des mouvements à partir de vidéos uploadées. Ce lancement illustre une tendance nette dans la robotique humanoïde chinoise : l'accent mis sur la commercialisation rapide plutôt que sur la recherche académique. Le positionnement de Luna, orienté interaction grand public et déploiement sans code, cible des intégrateurs et des opérateurs événementiels davantage que les lignes d'assemblage automobile. La démonstration synchronisée des 18 robots Oli, autre modèle de LimX (165 cm, 55 kg, bras à 7 DOF, portée de 70 cm, charge utile de 10 kg), est plus pertinente pour les décideurs industriels : elle illustre une capacité de déploiement coordonné autonome qui reste rare à cette échelle. Cela dit, les métriques annoncées méritent prudence : les améliorations thermiques et d'autonomie sont présentées sans conditions de test précises, et les vidéos publiées restent sélectionnées, ce qui rend difficile l'évaluation du gap simulation-réalité réel. LimX Dynamics opère dans un secteur sous forte pression concurrentielle. Figure AI (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0), NVIDIA (GR00T N2) et Apptronik (Apollo) animent le segment occidental, pendant que côté chinois, Unitree, Agibot et Fourier Intelligence disputent le même territoire. LimX se distingue par son architecture logicielle COSA, présentée comme un système d'exploitation cognitif gérant le contrôle de mouvement corps entier via des modèles physiques basse latence, et par la plateforme modulaire Tron 2 qui décline en configurations bimanuelle, bipède complète et biped-sur-roues. Ces briques technologiques suggèrent une stratégie de plateforme plutôt que de produit unique. Les prochaines étapes vraisemblables incluent des pilotes en environnements retail et événementiel en Chine, avant une tentative d'internationalisation dans des marchés où le coût d'entrée à 41 000 dollars reste compétitif face aux offres occidentales souvent non tarifées publiquement.

UELe positionnement tarifaire à 41 000 $ d'un humanoïde polyvalent chinois intensifie la pression concurrentielle sur les développeurs européens de robots humanoïdes comme Enchanted Tools ou Wandercraft, dont les prix restent non publiés.

Chine/AsieOpinion
1 source
La Chine attribue un identifiant numérique à chaque robot humanoïde pour renforcer les standards industriels
81SCMP Tech 

La Chine attribue un identifiant numérique à chaque robot humanoïde pour renforcer les standards industriels

La Chine a lancé vendredi le "Humanoid Full Lifecycle Management Service Platform", une initiative nationale visant à attribuer un identifiant numérique unique à chaque robot humanoïde fabriqué sur son territoire. Ces codes serviront à tracer les robots bipèdes dotés d'IA tout au long de leur cycle de vie, de la production jusqu'au déploiement opérationnel et à la maintenance. L'initiative s'inscrit dans un effort plus large de Pékin pour structurer un secteur en croissance rapide, en posant des bases réglementaires et des standards industriels communs. La décision est significative pour les intégrateurs et les acheteurs B2B : un système de traçabilité obligatoire implique une meilleure auditabilité des incidents, une gestion facilitée des responsabilités en cas de défaillance, et un registre centralisé permettant de surveiller les flottes déployées à l'échelle industrielle. Pour les décideurs, c'est un signal que la Chine passe d'une phase de course à la démo vers une maturité réglementaire, condition souvent nécessaire à l'adoption en environnement de production réel. C'est aussi un levier de différenciation compétitif : les fabricants chinois opérant dans un cadre normalisé auront plus facilement accès aux marchés industriels exigeants. La Chine compte aujourd'hui plusieurs acteurs humanoïdes de premier plan, dont Unitree Robotics (H1, G1), UBTECH (Walker S), Agibot et Fourier Intelligence, qui rivalisent avec des entreprises occidentales comme Figure AI (Figure 02), Physical Intelligence (pi0), et Tesla (Optimus Gen 2). L'instauration d'un registre national positionne Pékin comme précurseur en matière de gouvernance robotique, une dimension que ni l'Union Européenne ni les États-Unis n'ont encore formalisée à ce niveau de granularité. Les prochaines étapes pourraient inclure l'extension du dispositif aux robots mobiles industriels (AMR) et une interconnexion avec les systèmes de certification de sécurité fonctionnelle.

UELa Chine devance l'UE en instaurant un registre national obligatoire pour les robots humanoïdes, ce qui pourrait accélérer une réflexion réglementaire européenne dans le cadre de l'AI Act ou des initiatives France 2030 dédiées à la robotique.

Chine/AsieReglementation
1 source
GigaAI dévoile son système « Dual Pyramid » d'IA générale physique pour surmonter le mur du passage à l'échelle de l'IA incarnée
82Pandaily 

GigaAI dévoile son système « Dual Pyramid » d'IA générale physique pour surmonter le mur du passage à l'échelle de l'IA incarnée

Le 20 mai 2026, lors d'un événement de lancement dans l'Optical Valley de Wuhan, la startup chinoise GigaAI a dévoilé ce qu'elle appelle une architecture "Dual Pyramid" pour l'intelligence physique générale. Le système repose sur deux couches parallèles : une couche données qui fusionne dans un seul pipeline d'entraînement des données issues de robots réels (pour la physique de référence), de vidéos internet (pour la diversité situationnelle à grande échelle) et de simulation (pour la couverture synthétique illimitée) ; et une couche algorithmique qui empile des world models et des modèles VLA (Vision-Language-Action) comme piliers complémentaires. En parallèle, GigaAI a lancé SeeLight, une sous-marque dédiée aux environnements domestiques, ainsi que le SeeLight S1, son premier robot humanoïde polyvalent pour la maison. Une flotte de 100 unités est déjà déployée dans des foyers réels à Wuhan, avec un passage en opérations à grande échelle prévu pour le troisième trimestre 2026. La feuille de route sur 12 mois prévoit trois releases successives de modèles de base, GigaBrain-1, GigaBrain-2 et GigaBrain-3, que la société positionne comme l'équivalent du "moment GPT-3" pour la robotique physique généraliste. L'enjeu stratégique de cette annonce dépasse la présentation d'un nouveau robot : GigaAI s'attaque frontalement au débat qui structure le champ depuis deux ans. Le camp des world models, représenté par NVIDIA Cosmos et Google Genie, défend l'idée que des modèles vidéo génératifs peuvent fournir de la donnée d'entraînement à l'échelle industrielle. Le camp des modèles d'action, incarné par Physical Intelligence avec sa série pi-0 et les chercheurs en Diffusion Policy, argue que seules les données collectées sur robots réels permettent de généraliser les compétences de manipulation. En proposant une architecture hybride qui refuse ce choix binaire, GigaAI parie que world models et VLA ne sont pas concurrents mais codépendants. Si le déploiement des 100 unités en conditions réelles se confirme au-delà des vidéos de démonstration sélectionnées, cela constituerait une preuve sérieuse du sim-to-real scaling sur des tâches domestiques non structurées. La revendication d'un "GPT-3 moment" reste un signal marketing à surveiller avec prudence, mais l'architecture elle-même est techniquement cohérente avec les travaux récents sur les données hybrides. GigaAI s'inscrit dans une vague de startups chinoises en robotique humanoïde qui ont accéléré leurs sorties produit depuis 2024, en réponse directe aux annonces d'Agility Robotics (Digit), Figure (Figure 02), et Tesla (Optimus Gen 2). L'Optical Valley de Wuhan est devenu un pôle de référence pour la robotique en Chine, au même titre que Shenzhen pour le hardware grand public. La prochaine étape observable sera la publication de métriques de performance des unités SeeLight S1 dans des conditions d'utilisation domestique réelle, ainsi que le lancement de GigaBrain-1 selon le calendrier annoncé. Aucun acteur européen n'est directement impliqué dans cette annonce, mais les intégrateurs industriels et les décideurs robotique suivront de près la montée en échelle du Q3 2026 comme premier test de vérité.

UELa montée en échelle du SeeLight S1 prévue en Q3 2026 constituera un indicateur de compétitivité chinoise en robotique domestique que les acteurs industriels et décideurs européens devront intégrer dans leur veille stratégique.

Chine/AsieOpinion
1 source
Le robot humanoïde d'AGIBOT s'illustre par la danse et la calligraphie lors d'un événement culturel
83Interesting Engineering 

Le robot humanoïde d'AGIBOT s'illustre par la danse et la calligraphie lors d'un événement culturel

Le 21 mai 2026, la société chinoise AGIBOT a présenté son humanoïde pleine taille A2 lors d'un événement culturel à Jakarta, organisé en partenariat avec ASIX, accélérateur d'IA indonésien. Devant un public mixte, le robot a participé à une session de calligraphie en binôme avec des artistes humains, traçant la phrase "Tea for Harmony", avant d'enchaîner des performances de danse et des fonctions d'hôte interactif. Abel Deng, directeur régional Moyen-Orient et Asie-Pacifique d'AGIBOT, a qualifié 2026 de "jalon critique" pour atteindre un état de déploiement opérationnel, et a listé les applications industrielles et commerciales ciblées pour l'Indonésie : chargement et déchargement sur lignes de production, tri logistique, guidage en espace public, assistance retail, patrouilles de sécurité, inspections et nettoyage commercial. Aucun volume de déploiement, aucun tarif ni spécification technique détaillée du robot A2 n'ont été communiqués lors de l'événement. Il convient de distinguer nettement ce qui a été montré à Jakarta, une démonstration à visée culturelle et commerciale, de ce qui constitue un déploiement réel. Sur ce dernier point, AGIBOT avait franchi un cap concret plus tôt cette année en intégrant ses robots G2 sur une ligne de fabrication de tablettes active chez Longcheer Technology, l'un des premiers usages documentés d'un humanoïde en production d'électronique grand public. Le showcase jakartan relève davantage du positionnement géographique que de la mise en production. L'implication d'ASIX comme partenaire local signale une approche d'adaptation culturelle que plusieurs intégrateurs régionaux jugent indispensable pour réduire les frictions d'adoption dans des marchés à forte sensibilité sociale, notamment en Asie du Sud-Est où l'automatisation progresse rapidement dans les secteurs industriel et de services. AGIBOT est l'un des constructeurs chinois d'humanoïdes les mieux capitalisés, aux côtés d'Unitree Robotics, de Fourier Intelligence et d'UBTECH. Le segment reste extrêmement concurrentiel à l'échelle mondiale : Figure Robotics (Figure 03), Tesla (Optimus Gen 3), Agility Robotics (Digit, déployé chez Amazon), Physical Intelligence (pi-0), NVIDIA (GR00T N2) et Boston Dynamics (Atlas électrique) définissent chacun leur propre lecture du marché entre dextérité, autonomie cognitive et industrialisation à grande échelle. La présence de l'A2 au Met Gala de New York quelques semaines avant Jakarta illustre la double logique de la stratégie AGIBOT : image de marque globale d'un côté, pénétration B2B régionale de l'autre. Les suites annoncées incluent des pilotes dans les secteurs industriels et de services en Indonésie, sans calendrier précis ni volumes confirmés à ce stade.

UELa percée d'AGIBOT en Asie du Sud-Est illustre la stratégie d'internationalisation des constructeurs chinois d'humanoïdes, renforçant indirectement la pression concurrentielle sur les acteurs industriels et robotiques européens.

Chine/AsieOpinion
1 source
SONIC : un système de suivi du mouvement étendu pour le contrôle corporel intégral des humanoïdes
84arXiv cs.RO 

SONIC : un système de suivi du mouvement étendu pour le contrôle corporel intégral des humanoïdes

Des chercheurs présentent SONIC (arXiv:2511.07820), un modèle fondateur pour le contrôle corporel complet de robots humanoïdes, construit autour d'une mise à l'échelle agressive le long de trois axes : la capacité réseau (de 1,2 million à 42 millions de paramètres), le volume de données (plus de 100 millions de frames issues de 700 heures de capture de mouvement) et le calcul (21 000 heures GPU). La tâche centrale est le suivi de mouvement (motion tracking), utilisé comme proxy d'entraînement pour inculquer des priors sur le mouvement humain sans ingénierie manuelle de récompenses. Deux applications aval sont démontrées : un planificateur cinématique temps réel reliant le suivi de mouvement à des tâches de navigation, et un espace de tokens unifié permettant à une seule politique de gérer à la fois la téléopération VR et des modèles vision-langage-action (VLA). Dans ce second mode, le système réalise de la loco-manipulation autonome en coordonnant simultanément position des mains et des pieds. L'apport principal est d'étendre les lois de scaling, jusqu'ici réservées aux grands modèles de langage, au contrôle humanoïde à corps complet. Les auteurs montrent que les performances progressent de manière régulière avec la quantité de données et le calcul, et que les politiques apprises généralisent à des mouvements non vus à l'entraînement, sans nécessiter de reward shaping manuel. Pour les intégrateurs, l'interface unifiée VR-VLA dans un seul modèle réduit le coût d'adaptation entre téléopération humaine et autonomie. Il convient néanmoins de noter qu'il s'agit d'une publication académique, non d'un produit déployé, et que les démonstrations vidéo sélectionnées ne permettent pas encore d'évaluer la robustesse en conditions industrielles réelles. SONIC s'inscrit dans une course au scaling qui agite l'ensemble de la filière humanoïde. Physical Intelligence a publié Pi-0, un modèle VLA polyvalent ; NVIDIA a lancé GR00T N2 en s'appuyant sur des données synthétiques massives ; Figure et Tesla visent des architectures propriétaires à grande échelle avec Optimus Gen 3. Les 42 millions de paramètres de SONIC restent modestes comparés aux VLA les plus ambitieux, et le travail ne mentionne pas d'affiliation à un fabricant de robot ni de calendrier de déploiement physique. La prochaine étape logique serait une validation sur hardware réel avec des évaluations quantitatives standardisées, un exercice que les benchmarks émergents du secteur commencent tout juste à formaliser.

IA physiqueOpinion
1 source
Manipulation corps entier des humanoïdes via un cerveau spatial actif et un cervelet d'action généralisable
85arXiv cs.RO 

Manipulation corps entier des humanoïdes via un cerveau spatial actif et un cervelet d'action généralisable

Des chercheurs ont publié le 27 mai 2026 un preprint (arXiv:2605.21133) présentant un framework de loco-manipulation pour robots humanoïdes baptisé ASB-GAC, articulé autour de deux modules distincts. Le premier, Active Spatial Brain (ASB), assure la perception spatiale active et la planification de tâches en décomposant les objectifs en sous-tâches. Le second, Generalizable Action Cerebellum (GAC), traduit ces décisions en commandes moteur exécutables sur robot réel. L'approche s'appuie sur des grands modèles multi-agents pour orchestrer perception et génération d'actions. Les auteurs ont conçu un jeu de tâches de manipulation spatiale dépassant le cadre classique de la table rase, couvrant des environnements 3D avec des relations spatiales variées, et mesurent les performances sur deux axes : compréhension spatiale et exécution physique réelle. Le point saillant de ce travail est l'affirmation que GAC génère des actions robot exécutables sans données réelles spécifiques à chaque tâche, ce qui s'attaque directement au goulot d'étranglement majeur du secteur : collecter des trajectoires sur robot physique coûte cher et ne se généralise pas. Si la validité de cette approche se confirme au-delà des benchmarks maison, cela pourrait réduire significativement le cycle de développement pour les intégrateurs cherchant à déployer des humanoïdes sur des tâches variées d'entrepôt ou d'assemblage. Toutefois, le preprint ne fournit pas de métriques de cycle time, de taux de succès détaillés ni de comparaisons quantitatives directes avec des baselines comme pi0 (Physical Intelligence) ou GR00T N2 (NVIDIA), ce qui limite l'évaluation indépendante des claims de généralisation. Ce travail s'inscrit dans une dynamique de recherche très active sur la manipulation whole-body, où la fracture entre simulation et réalité reste un verrou central. Des acteurs comme Figure AI avec Figure 03, Tesla avec Optimus Gen 3, ou Physical Intelligence avec pi0 ont tous investi massivement dans la collecte de données réelles pour combler ce fossé. L'approche sim-to-real et l'utilisation de VLA (Vision-Language-Action models) comme vecteur de généralisation sont aujourd'hui les deux grandes stratégies concurrentes. Ce preprint propose une troisième voie par décomposition hiérarchique via LLM multi-agents, mais sans nom d'entreprise, sans robot cible identifié, et sans annonce de pilote industriel : il s'agit pour l'instant d'un résultat académique à surveiller avant tout transfert vers le terrain.

IA physiquePaper
1 source
Une nouvelle main robotique chinoise combine un actionnement hybride pour améliorer la préhension
86Interesting Engineering 

Une nouvelle main robotique chinoise combine un actionnement hybride pour améliorer la préhension

La startup chinoise Xynova a dévoilé la Flex 2, sa main robotique de deuxième génération, conçue pour équiper les robots humanoïdes de capacités de manipulation proches de celles de la main humaine. Le système embarque 23 degrés de liberté pour un poids de 400 grammes, et atteint une cadence de deux extensions de poing par seconde. Sa répétabilité est annoncée à ±0,1 mm, avec une précision de contrôle de force descendant à 0,05 newtons, ce qui lui permet de saisir des objets fragiles ou de forme irrégulière sans les endommager. La charge utile en préhension atteint 12 kg en pic et 4 kg en continu. Xynova revendique un score parfait au test de Kapandji, référence clinique pour évaluer l'opposition du pouce, ainsi qu'une résistance à la poussière, aux chutes et aux impacts compatible avec des millions de cycles opérationnels. La main intègre un système de perception multi-modal comprenant capteurs tactiles, proprioception et un module de détection de glissement, que l'entreprise qualifie de "cervelet artificiel" adaptatif. La Flex 2 illustre une tendance de fond dans la conception des mains robotiques : l'hybridation des modes d'actionnement. Le système combine des tendons à câbles, qui apportent compliance et légèreté, avec une actuation directe qui fournit le couple nécessaire aux tâches de contact précis. Ce compromis cherche à surmonter l'un des obstacles persistants du secteur : la manipulation dite "au dernier centimètre", soit la capacité à exécuter des gestes contact-riches hors d'environnements contrôlés. Xynova a également repositionné la caméra du système de vision depuis la paume vers le poignet, ce qui réduit les problèmes d'occlusion lors de la saisie et améliore la qualité des données collectées pour entraîner des pipelines VLA (vision-language-action) utilisés dans les systèmes d'IA incarnée. C'est une décision architecturale modeste en apparence, mais potentiellement significative pour quiconque développe des politiques d'imitation learning sur données visuelles. Xynova s'inscrit dans une vague de startups chinoises spécialisées dans la manipulation dextre, un segment en croissance rapide depuis que les grands intégrateurs humanoïdes comme Figure AI (Figure 03), Tesla (Optimus Gen 3) ou Physical Intelligence (Pi-0) ont montré les limites des préhenseurs rigides industriels sur des tâches non structurées. Le précédent modèle de Xynova, la Flex 1, affichait 25 DOF, 380 grammes et une force d'extrémité de doigt de 20 N pour une charge de 30 kg, positionnant déjà la marque sur le segment haute performance. Avec la Flex 2, l'entreprise pivote explicitement vers la fidélité de contrôle lors des interactions physiques plutôt que vers les seules métriques hardware. Aucun prix public ni calendrier de livraison commerciale n'ont été communiqués à ce stade : la Flex 2 reste pour l'instant une annonce produit sans déploiement confirmé.

Chine/AsieActu
1 source
Premier enchères mondial pour robots humanoïdes, présenté lors du plus grand événement commercial de Chine
87Interesting Engineering 

Premier enchères mondial pour robots humanoïdes, présenté lors du plus grand événement commercial de Chine

JD.com, géant chinois du e-commerce, a annoncé le lancement de la première vente aux enchères mondiale de robots humanoïdes, prévue dans le cadre de son festival annuel "618" prévu en juin 2026. L'initiative a été dévoilée lors de la conférence de lancement de l'édition 2026 du festival, sans que la liste des modèles disponibles à l'enchère ne soit encore communiquée. L'annonce s'inscrit dans un plan de déploiement robotique plus large sur cinq ans : JD.com vise l'intégration de 3 millions de robots, 1 million de véhicules autonomes et 100 000 drônes dans ses opérations. Pour 2026 seul, JD Retail cible un chiffre d'affaires robotique supérieur à 1,47 milliard de dollars, avec un objectif de réduction des cycles de lancement produit de 30 %. La plateforme robotique maison JoyInside, dirigée par Dai Wenjun, vise une connexion à plus de 10 millions de terminaux cette année, avec Unitree Robotics et Noetix Robotics déjà intégrés. En parallèle, Shanghai a annoncé son intention de déployer 100 000 robots humanoïdes dans les usines d'ici la fin du 15e Plan quinquennal (2026-2030), avec un objectif d'adoption des agents IA supérieur à 80 % dans les grandes entreprises industrielles. Ces annonces illustrent un pivot majeur dans la trajectoire commerciale des humanoïdes en Chine : la vente aux enchères publique est un signal de repositionnement, cherchant à normaliser ces machines aux yeux des acheteurs professionnels et grand public, plutôt qu'à les cantonner aux salons et démonstrations. Pour les intégrateurs et les décideurs industriels, l'intégration de fabricants comme Unitree dans une plateforme e-commerce à grande échelle crée un canal de distribution inédit, potentiellement capable d'accélérer les cycles d'adoption en entreprise. Il reste cependant à noter que les chiffres avancés (3 millions de robots, 100 000 humanoïdes en usine) sont des objectifs déclaratifs, sans métriques de déploiement réel à date, et que les modèles concrets mis aux enchères n'ont pas été précisés, limitant la portée opérationnelle immédiate de l'annonce. La Chine consolide ainsi sa stratégie d'intégration de l'IA incarnée à l'échelle industrielle, dans un contexte de compétition internationale intense. Unitree Robotics, dont les robots G1 et H1 ont acquis une visibilité mondiale, et Noetix représentent la vague actuelle des fabricants chinois d'humanoïdes qui cherchent à passer du stade de la démonstration à celui du produit commercialisable. Face à eux, Figure (avec le 03), Boston Dynamics, Agility Robotics et Tesla (Optimus Gen 3) structurent le paysage occidental. L'enchère JD.com pourrait servir de test de marché grandeur nature avant des déploiements industriels planifiés dès 2026, avec Shanghai comme vitrine nationale des ambitions chinoises en robotique humanoïde.

UELa montée en puissance commerciale de l'écosystème humanoïde chinois (JD.com, Unitree) intensifie la pression concurrentielle sur les fabricants et intégrateurs européens, sans impact direct immédiat sur la France ou l'UE.

Chine/AsieOpinion
1 source
OxyGen : gestion unifiée du cache KV pour l'inférence de modèles VLA en parallélisme multi-tâches
88arXiv cs.RO 

OxyGen : gestion unifiée du cache KV pour l'inférence de modèles VLA en parallélisme multi-tâches

Une équipe de chercheurs propose OxyGen, un système de gestion unifiée du cache KV (Key-Value) pour l'inférence des modèles VLA (Vision-Language-Action) sous parallélisme multi-tâches, décrit dans un preprint arXiv (2503.14371). Le travail cible en particulier π₀.₅, le modèle VLA de type Mixture-of-Transformers (MoT) développé par Physical Intelligence, une startup robotique fondée en 2023 par d'anciens chercheurs de Google et DeepMind. Sur un GPU NVIDIA GeForce RTX 4090, OxyGen atteint jusqu'à 3,7 fois la vitesse d'exécution par rapport à un système isolé classique, tout en maintenant simultanément un débit de plus de 200 tokens/s en génération de langage et une fréquence d'action de 70 Hz. Ces résultats ont également été validés sur un robot humanoïde physique embarquant un Jetson AGX Thor, la carte de calcul ciblée par NVIDIA pour les déploiements robotiques edge. Le problème que résout OxyGen est concret : lorsqu'un agent robotique doit exécuter simultanément plusieurs tâches (manipulation, conversation, mise à jour mémoire) à partir d'une même observation visuelle partagée, les systèmes d'inférence existants recalculent indépendamment le cache KV pour chaque tâche, générant une redondance coûteuse et une contention de ressources. Les auteurs identifient la gestion isolée des caches KV comme la cause racine et proposent deux optimisations clés : le partage cross-tâches du cache KV, qui élimine le recalcul des tokens d'observation lors du prefill, et le batching continu inter-frames, qui désolidarise la génération de langage à longueur variable de la génération d'actions à cadence fixe. Cette architecture est particulièrement structurante pour les intégrateurs qui cherchent à déployer des VLAs sur du matériel embarqué sans recourir à des serveurs GPU distants, un verrou majeur pour la commercialisation des robots à intelligence embarquée. Les modèles VLA de type MoT, dont π₀ (publié en octobre 2024) et π₀.₅ sont les représentants les plus visibles, routent les sorties hétérogènes vers des blocs transformer spécialisés tout en partageant un encodeur d'observation commun, ce qui rend techniquement possible le partage de cache KV inter-tâches proposé par OxyGen. Sur le plan concurrentiel, ce type d'optimisation d'inférence concerne aussi les VLAs de Google DeepMind (Gemini Robotics), OpenVLA, ainsi que les projets internes de Tesla pour Optimus Gen 3. Il s'agit à ce stade d'une contribution de recherche sans déploiement industriel annoncé, mais la validation sur robot réel avec Jetson AGX Thor embarqué indique une trajectoire claire vers le déploiement on-device à grande échelle.

IA physiqueOpinion
1 source
Boston Dynamics révèle comment Atlas soulève des charges industrielles de 45 kg en production
89Interesting Engineering 

Boston Dynamics révèle comment Atlas soulève des charges industrielles de 45 kg en production

Boston Dynamics a publié début 2025 un billet technique détaillant comment son robot humanoïde Atlas a appris à manipuler des charges industrielles lourdes grâce au reinforcement learning et à la simulation à grande échelle. La démonstration montre Atlas effectuer une rotation du torse à 180 degrés, se baisser pour saisir un mini-réfrigérateur, puis le transporter sur plusieurs mètres en compensant le déplacement du poids interne de l'objet. La charge nominale d'entraînement se situe entre 23 et 32 kg (50-70 lb), mais le robot a réussi à déplacer un réfrigérateur dépassant les 45 kg (100 lb) lors des tests. Pour percevoir le poids, l'équilibre et la résistance, Atlas s'appuie principalement sur la proprioception, c'est-à-dire la conscience interne de son propre corps, plutôt que sur la vision seule. L'entraînement repose sur des millions d'heures de simulation parallèle sur GPU, où l'on fait varier le poids de l'objet, le frottement au sol, la force de préhension et la position initiale de la charge pour forcer le robot à généraliser ses comportements. Ce que cette publication révèle, au-delà de la performance brute, c'est une avancée méthodologique sur le problème dit du "sim-to-real gap" : l'écart historique entre les comportements appris en simulation et leur transposition sur le robot physique. Boston Dynamics affirme l'avoir réduit grâce à une architecture matérielle délibérément simplifiée : Atlas n'utilise que deux types d'actionneurs sur l'ensemble du corps, les bras et les jambes sont symétriques, et les câbles ont été éliminés au niveau des articulations, autorisant une rotation continue des joints et réduisant les sources d'usure et de latence. Pour les intégrateurs industriels et les décideurs B2B, cela signifie que la simulation devient un outil de développement comportemental fiable, raccourcissant potentiellement les cycles de mise en production. Le fait que le comportement de levage ait été développé en quelques semaines seulement après le lancement public d'Atlas est un signal fort sur la scalabilité du pipeline d'entraînement. Il faut toutefois noter que la démonstration reste une vidéo sélectionnée en laboratoire : aucun déploiement terrain ni données de fiabilité sur durée longue ne sont communiqués. Boston Dynamics, rachetée par Hyundai en 2021 pour 1,1 milliard de dollars, a rebooté Atlas en version entièrement électrique début 2024, abandonnant la plateforme hydraulique utilisée depuis 2013. Ce nouvel Atlas se positionne explicitement comme un "outil polyvalent pour le travail physique", en concurrence directe avec Figure (Figure 02 et 03 annoncés), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0), Agility Robotics (Digit), et NVIDIA dans l'écosystème GR00T N2. La décision de lier les démonstrations athlétiques d'Atlas, dont des figures au sol et des backflips, à des cas d'usage industriels est une communication stratégique visant à montrer que l'agilité n'est pas une fin en soi mais un proxy pour la robustesse en environnement difficile. Les prochaines étapes annoncées concernent des pilotes en environnement industriel réel, notamment avec BMW, sans calendrier précis communiqué.

UEUn pilote industriel avec BMW (groupe allemand) est évoqué sans calendrier précis, signal pertinent pour les intégrateurs européens qui évaluent les humanoides en environnement de production.

HumanoïdesOpinion
1 source
Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée
90Interesting Engineering 

Robot humanoïde abordable à 15 000 dollars : un kit pour démocratiser la robotique avancée

Menlo Research, une startup basée à Singapour, a lancé un kit de construction pour son robot humanoïde open-source Asimov, vendu environ 15 000 dollars, soit un prix proche du coût réel de ses composants selon la liste publiée sur GitHub. Le robot mesure 1,20 mètre, pèse 35 kilogrammes et dispose de plus de 25 degrés de liberté. Livré entièrement démonté, avec manuels et vidéos de montage, il cible chercheurs, développeurs et hobbyistes avancés. L'architecture est entièrement modulaire : jambes, bras, torse et tête s'interconnectent via des fixations moteur universelles, permettant le remplacement ou la mise à niveau de composants sans refonte globale. La cheville utilise un mécanisme parallèle RSU (Revolute-Spherical-Universal) à deux degrés de liberté (roulis et tangage), améliorant la distribution du couple sur terrain irrégulier. Les orteils sont passifs (non actionnés), simplifiant la transition appui-poussée et réduisant la charge calculatoire. Les pièces structurelles sont optimisées pour l'impression 3D Multi Jet Fusion (MJF), éliminant le recours à l'usinage CNC coûteux. Côté logiciel, l'entraînement repose sur une approche "Processor-in-the-Loop" (PIL) qui injecte délibérément des imperfections réalistes : latences CANBus simulées jusqu'à 9 millisecondes et bruit de capteurs via une couche d'émulation I2C. Un framework Asymmetric Actor-Critic sépare le "critic" (accès aux données de simulation exactes) de l'"actor" (signaux bruités et retardés comme en conditions matérielles réelles), aboutissant à un transfert sim-to-real en zéro-shot : marche avant et arrière, récupération après poussées externes, sans calibration supplémentaire sur le robot physique. Ce positionnement tarifaire est notable dans un secteur où les plateformes humanoïdes commerciales de référence restent fermées ou inaccessibles aux équipes indépendantes. Le zero-shot sim-to-real représente l'un des verrous historiques de la locomotion humanoïde ; l'approche PIL, qui force le modèle à apprendre sous latence et bruit réalistes dès la phase simulation, constitue une réponse directe au problème classique du sim-to-real gap que rencontrent des projets comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA lors du passage à l'échelle. Pour un laboratoire de recherche ou un intégrateur, cela représente un cycle de développement potentiellement plus court entre simulation et déploiement terrain, sans nécessiter de fine-tuning sur matériel physique coûteux. Menlo Research s'inscrit dans la tendance d'open-sourcing de la robotique humanoïde, aux côtés de l'Open Dynamic Robot Initiative et du Unitree H1 (environ 20 000 dollars, firmware partiellement ouvert). Asimov ne rivalise pas directement avec Figure 03, Tesla Optimus Gen 3 ou Agility Digit pour les déploiements industriels à grande échelle : il cible le segment recherche et éducation, aujourd'hui peu couvert par des plateformes réellement capables de locomotion autonome. La publication du bill-of-materials complet sur GitHub renforce la crédibilité de la démarche, même si 15 000 dollars reste hors portée du grand public et que les performances annoncées n'ont pas encore été validées de manière indépendante. Les prochaines étapes annoncées portent sur l'amélioration de la stack logicielle et l'élargissement de la communauté open-source autour du projet.

HumanoïdesActu
1 source
Vidéo : le cerveau robotique de Genesis permet une manipulation au niveau humain et un entraînement à grande échelle
91Interesting Engineering 

Vidéo : le cerveau robotique de Genesis permet une manipulation au niveau humain et un entraînement à grande échelle

Genesis AI a présenté GENE-26.5, un modèle de fondation robotique conçu pour doter les robots de capacités de manipulation au niveau humain. La vidéo de démonstration publiée par l'entreprise montre des robots accomplissant une séquence culinaire de 20 étapes (couper des tomates, casser un oeuf d'une seule main, coordonner les deux bras pendant la cuisson), ainsi que la préparation d'un smoothie avec service en l'air, des tâches de laboratoire (pipettage, transfert de liquides), du câblage pour assemblage électronique, la résolution d'un Rubik's Cube en manipulation aérienne continue, et l'interprétation d'une pièce de piano rapide. Pour alimenter l'entraînement du modèle, l'entreprise a développé un gant haptique équipé d'une peau électronique à capteurs tactiles, établissant une correspondance 1:1:1 entre la main humaine, le gant et la main robotique. Genesis revendique un coût matériel cent fois inférieur aux solutions de télé-opération conventionnelles, et une efficacité de collecte de données cinq fois supérieure. Le moteur de données associé intègre également des vidéos égocentriques issues de caméras portables et des vidéos publiques centrées sur l'activité humaine. Ces résultats, s'ils se confirment en environnement réel non contrôlé, représentent une avancée potentiellement significative sur l'un des verrous les plus tenaces de la robotique : l'écart d'incarnation (embodiment gap) entre les mains humaines et robotiques, qui limite depuis des années la transférabilité des données d'entraînement. La cartographie 1:1 glove-to-robot est une approche déjà explorée par des acteurs comme Physical Intelligence (pi-0) et plusieurs laboratoires académiques, mais Genesis revendique une démonstration à une échelle et une polyvalence inédites. Pour les intégrateurs industriels et les décideurs cherchant à automatiser des tâches non structurées (assemblage fin, préparation culinaire en volume, logistique d'entrepôt), la promesse d'un système généraliste capable d'apprendre directement des gestes humains quotidiens, sans retraining extensif, représenterait un changement de paradigme. Il faut toutefois noter que les démonstrations sont des vidéos éditées, sans données indépendantes sur le taux d'échec, les conditions d'éclairage, ou la reproductibilité en cycle de production continu. Genesis AI s'inscrit dans un segment en forte concurrence avec Physical Intelligence (pi-0, Berkeley), Figure AI (Figure 03, déployé avec BMW), Tesla (Optimus Gen 3), NVIDIA (GR00T N2) et Apptronik (Apollo). L'approche par gant haptique à bas coût rappelle les travaux d'Enchanted Tools, acteur français du service robotique, qui mise également sur la capture de mouvement humain pour réduire le coût d'entraînement. Genesis n'a pas encore annoncé de déploiements industriels confirmés ni de partenariats nominatifs : GENE-26.5 reste à ce stade une annonce de produit accompagnée d'une démonstration vidéo, pas un système disponible commercialement. L'entreprise indique prévoir le déploiement de ses gants en milieu de travail réel via des partenariats industriels, avec pour objectif de constituer une bibliothèque de compétences humaines à grande échelle pour l'entraînement robotique.

IA physiqueActu
1 source
Hello Robot établit la référence en matière de robots domestiques pratiques et sûrs
92IEEE Spectrum Robotics 

Hello Robot établit la référence en matière de robots domestiques pratiques et sûrs

Hello Robot annonce Stretch 4, une nouvelle version de son robot domestique non-humanoïde, conçu pour des déploiements pilotes réels dans des environnements résidentiels. La rupture principale avec les versions précédentes est l'intégration d'une base omnidirectionnelle : le robot peut désormais se translater dans n'importe quelle direction sans avoir à pivoter au préalable, grâce à des roues omnidirectionnelles initialement développées pour les fauteuils roulants motorisés, après six mois de développement dédié. La tête pan-tilt d'origine est remplacée par une suite sensorielle plus complète offrant un champ de vision nettement élargi : deux lidars hémisphériques, des caméras Luxonis pour la vision et la navigation, et une caméra de profondeur montée sur le poignet pour la manipulation. L'architecture de calcul repose sur un Intel NUC 15 pour le système principal, complété par un NVIDIA Jetson Orin NX mis à disposition des chercheurs pour le traitement visuel et l'IA. Le robot embarque des capacités autonomes de base (cartographie, navigation, autocharge) ainsi que des fonctionnalités de démonstration comme la saisie autonome d'objets. Aucun prix public n'a été communiqué, mais Hello Robot positionne Stretch 4 comme accessible comparé aux humanoïdes actuels. Ce lancement illustre une thèse alternative à la course aux humanoïdes : Aaron Edsinger (CEO) et Charlie Kemp (CTO) misent sur la sécurité, le coût maîtrisé et la praticabilité réelle plutôt que sur la morphologie anthropomorphe. La philosophie de Hello Robot sur l'autonomie tranche nettement avec le secteur : plutôt que de collecter massivement des données en espérant qu'une autonomie commercialement viable en émergera, l'entreprise conserve un opérateur humain dans la boucle, à des niveaux variables allant du contrôle direct à la supervision pure. Cette posture est plus prudente mais aussi plus immédiatement intégrable dans des contextes réels, notamment pour des intégrateurs ou des opérateurs non spécialisés. Sur le plan sensoriel, Hello Robot a renoncé à l'approche "Tesla" (multitude de caméras bon marché) au profit d'une logique "Waymo" : des données plus riches et fiables pour un comportement plus sûr et intelligent, au détriment potentiel du coût. Stretch existe depuis plusieurs années comme plateforme de recherche, avec une communauté active dans les laboratoires universitaires. Hello Robot a été fondé sur le principe du robot minimaliste, et Stretch 4 est le premier modèle explicitement conçu pour franchir le seuil vers des déploiements opérationnels. Le secteur de la robotique humanoïde est actuellement dominé par des acteurs très capitalisés comme Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0) et NVIDIA (GR00T N2), tous positionnés sur des cas d'usage industriels ou logistiques. Hello Robot occupe une niche différente : le marché domestique et de service, avec une approche morphologiquement sobre et des coûts structurellement plus bas. La prochaine étape annoncée est une phase de déploiements pilotes en environnement résidentiel réel, destinée à qualifier les conditions de passage à l'échelle.

UELes laboratoires de recherche européens utilisant la plateforme Stretch pourraient bénéficier de cette nouvelle version, mais aucun déploiement ou partenariat européen n'est annoncé.

IA physiqueOpinion
1 source
Évolution supervisée des capacités des agents incarnés : mise à niveau sûre, vérification de compatibilité et retour arrière en temps réel
93arXiv cs.RO 

Évolution supervisée des capacités des agents incarnés : mise à niveau sûre, vérification de compatibilité et retour arrière en temps réel

Une équipe de chercheurs a formalisé dans un preprint arXiv (réf. 2604.08059) un cadre de mise à jour sécurisée pour les modules de capacités d'agents embarqués. Le problème est concret: lorsqu'un robot améliore ses capacités via des mises à jour de modules logiciels, comment garantir que ces déploiements ne violent pas les contraintes de sécurité, les hypothèses d'exécution ou les mécanismes de récupération? Le framework introduit quatre vérifications de compatibilité (interface, politique, comportementale, récupération) organisées en pipeline séquentiel: validation du candidat, évaluation sandbox, déploiement shadow, activation contrôlée, monitoring en ligne et rollback. Sur 6 cycles de mise à jour avec 15 graines aléatoires, une mise à jour naïve atteint 72,9% de succès sur les tâches mais génère 60% d'activations non sécurisées au dernier cycle; le framework gouverné maintient 67,4% de succès avec zéro activation non sécurisée sur l'ensemble des cycles (test de Wilcoxon, p=0,003). Le shadow deployment détecte 40% des régressions invisibles à la sandbox seule, et le rollback réussit dans 79,8% des scénarios de dérive post-activation. Pour les intégrateurs de systèmes robotiques et les décideurs B2B, ce résultat répond à une question stratégique: peut-on industrialiser la mise à jour continue d'un robot en production sans requalification complète du système? La démonstration montre que c'est faisable, la perte de performance étant limitée à 5,5 points de taux de succès en échange d'une garantie de sécurité absolue. La découverte clé porte sur le shadow deployment: 40% des régressions n'apparaissent pas en environnement sandbox, invalidant les workflows de qualification qui s'y arrêtent. Cela pose les bases d'un CI/CD robotique viable, à condition d'inclure une étape shadow en environnement réel. Les travaux antérieurs avaient étudié séparément le packaging modulaire, l'évolution des capacités et la gouvernance à l'exécution, sans les assembler en pipeline cohérent. Cette publication formalise la "governed capability evolution" comme problème de systèmes de premier ordre, directement pertinent pour les architectures à base de VLA (Vision-Language-Action models) qui évoluent rapidement sur des plateformes comme Figure 03, Optimus Gen 3 ou GR00T N2. L'article reste un travail de recherche évalué en simulation, sans déploiement commercial cité; les prochaines étapes attendues sont une validation sur plateformes physiques réelles et une intégration dans des pipelines MLOps robotiques.

RecherchePaper
1 source
Genesis AI introduit GENE-26.5, un modèle pour une manipulation robotique plus dextérique
94Robotics Business Review 

Genesis AI introduit GENE-26.5, un modèle pour une manipulation robotique plus dextérique

Genesis AI, startup californienne fondée par Zhou Xian et basée à San Carlos, a dévoilé GENE-26.5, un modèle fondamental d'IA conçu pour la manipulation robotique dextre bimanuelle. Sortie de stealth l'an dernier avec une levée de 105 millions de dollars, l'entreprise annonce avoir résolu le principal verrou du secteur : le manque de données d'entraînement pour les tâches à haute dextérité. GENE-26.5 repose sur deux composants propriétaires : un moteur de données à grande échelle et une main robotique dimensionnée à l'échelle humaine, couplée à un gant de collecte doté d'une peau électronique tactile. Ce gant permet une correspondance 1:1:1 entre la main du démonstrateur, le gant et l'effecteur robotique, facilitant le transfert direct de compétences humaines vers le robot sans recodage. Pour illustrer les capacités du modèle, Genesis AI a publié des vidéos montrant la réalisation d'une recette en 20 étapes (découpe de tomates, cassage d'oeuf à une seule main, coordination bimanuelle), la préparation d'un smoothie avec service en vol, des expériences de laboratoire impliquant pipetage et transferts de liquides, du câblage de faisceaux électriques, la résolution d'un Rubik's Cube en manipulation aérienne, la préhension simultanée de quatre objets de tailles différentes, et l'interprétation d'une composition pianistique complexe. L'enjeu industriel est direct : le câblage de faisceaux électriques, désigné par l'entreprise comme "l'une des tâches les plus difficiles en électronique", représente des milliers de postes non automatisés dans les secteurs automobile et aérospatial, faute de robots capables de gérer la variabilité géométrique des fils. Si les performances démontrées se confirment hors conditions de laboratoire contrôlées - ce que des vidéos promotionnelles soigneusement sélectionnées ne permettent pas d'établir -, cela ouvrirait un marché significatif pour les intégrateurs cherchant à robotiser des tâches à haute variabilité morphologique. L'approche de Genesis AI vise à combler l'"embodiment gap" : l'écart de morphologie entre humain et robot qui a historiquement limité l'efficacité des modèles entraînés sur données humaines. L'investissement d'Eric Schmidt, ex-PDG de Google, dans la société souligne l'intérêt stratégique croissant pour ce segment au-delà du seul milieu robotique. Genesis AI s'inscrit dans une course à la manipulation dextre où plusieurs acteurs avancent en parallèle : Physical Intelligence avec son modèle Pi-0, Sanctuary AI et les équipes manipulation de Figure (Figure 03) et Tesla (Optimus Gen 3) développent également des architectures de type VLA (Vision-Language-Action) pour le contrôle fin des effecteurs. Genesis AI se distingue en concentrant son offre exclusivement sur la main et la manipulation bimanuelles, sans plateforme humanoide annoncée à ce stade. Le communiqué reste toutefois vague sur les suites opérationnelles : aucun pilote industriel nommé, aucune timeline de déploiement ni tarification n'est communiqué, ce qui place cette annonce clairement du côté de la démonstration technologique plutôt que du produit commercialisé.

IA physiqueOpinion
1 source
Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes
95arXiv cs.RO 

Rhythm : apprentissage du contrôle interactif corps entier pour deux robots humanoïdes

Des chercheurs ont publié en mars 2026 sur arXiv un framework baptisé Rhythm, conçu pour piloter simultanément deux robots humanoïdes Unitree G1 en interaction physique directe. Le système repose sur trois composants : un module IAMR (Interaction-Aware Motion Retargeting) qui génère des références de mouvement réalistes à partir de captures de données humaines, une politique d'apprentissage par renforcement IGRL (Interaction-Guided Reinforcement Learning) qui modélise les dynamiques de contact couplées via des récompenses basées sur des graphes, et un pipeline de transfert sim-to-real permettant de déployer ces comportements sur robots physiques. Les comportements validés incluent l'accolade et la danse synchronisée entre deux G1, transférés de simulation vers le monde réel. Il s'agit d'un travail académique, pas d'un produit commercialisé. L'intérêt technique est dans la résolution du problème de contact couplé multi-corps : quand deux humanoïdes se touchent, les efforts mécaniques se propagent en boucle entre les deux chaînes cinématiques, rendant le contrôle instable. Rhythm aborde ce problème par des récompenses graph-based qui capturent explicitement l'interaction entre les deux agents, plutôt que de traiter chaque robot indépendamment. Pour un intégrateur ou un ingénieur robotique, c'est une validation que le sim-to-real fonctionne même pour des dynamiques de contact bilatérales, un verrou qui bloquait la plupart des approches multi-robots à manipulation physique. Cela ouvre la voie à des tâches collaboratives exigeant une coordination fine, comme le port de charges lourdes à deux, le transfert d'objets ou l'assemblage bimanuel étendu. Le robot Unitree G1 est une plateforme commerciale accessible (environ 16 000 dollars), ce qui donne à ces résultats une reproductibilité supérieure aux travaux sur robots propriétaires. Dans la course aux humanoïdes, les acteurs comme Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0) et Boston Dynamics se concentrent sur des déploiements unitaires en environnement industriel ; la coordination physique entre deux humanoïdes reste un espace peu exploré commercialement. Rhythm ne s'inscrit pas encore dans une roadmap produit annoncée, mais la disponibilité du code sur arXiv et le choix du G1 suggèrent une communauté de recherche qui converge vers la standardisation des plateformes, préfigurant des pilotes industriels à horizon 18-36 mois.

RecherchePaper
1 source
SixthSense : estimation générique du torseur corps entier par proprioception seule pour humanoïdes
96arXiv cs.RO 

SixthSense : estimation générique du torseur corps entier par proprioception seule pour humanoïdes

Des chercheurs ont publié début mai 2026 sur arXiv (réf. 2605.01427) SixthSense, un système d'estimation des forces et couples de contact (wrenches) pour robots humanoïdes fonctionnant exclusivement à partir de la proprioception et d'une centrale inertielle (IMU), sans capteur de force-couple dédié. Le système infère en temps réel le moment, la localisation et l'amplitude des wrenches appliqués sur l'ensemble du corps, même lorsque les points de contact sont indéterminés. Techniquement, SixthSense emploie le conditional flow matching pour tokeniser des historiques proprioceptifs et estimer un flux d'événements de contact spatialement et temporellement parcimonieux. Les validations expérimentales couvrent trois régimes distincts - posture statique, marche et suivi de trajectoire corps entier - avec des performances décrites comme "sans précédent" par les auteurs, bien que l'article ne publie pas de métriques comparatives chiffrées pour étayer cette affirmation. L'enjeu est concret pour l'intégration industrielle : les humanoïdes actuellement déployés (Figure 02, Optimus Gen 2, Unitree G1) manquent de perception fiable des efforts de contact pour des tâches exigeant une interaction physique précise - assemblage, manipulation d'objets fragiles, collaboration en cellule mixte. Les méthodes analytiques existantes supposent des contacts connus et des mesures souvent indisponibles en production, notamment en raison de la dynamique en base flottante propre aux bipèdes. SixthSense se présente comme un module plug-and-play intégrable sans modification matérielle, ciblant trois cas d'usage : détection de collision, interaction physique humain-robot (pHRI) et téléopération avec retour d'effort. Ce travail s'inscrit dans l'effort plus large visant à combler le fossé entre démonstrations en laboratoire et déploiements réels pour la perception haptique des humanoïdes. Les principaux acteurs commerciaux - Figure, Agility Robotics, Apptronik, 1X Technologies - comme les plateformes académiques partagent ce même déficit. En France, Wandercraft, spécialiste de l'exosquelette humanoïde pour la rééducation, fait face à des contraintes similaires pour la perception d'effort en interaction avec le patient. La publication demeure une contribution académique : aucun déploiement industriel ni partenariat commercial n'est annoncé, et la robustesse hors conditions contrôlées reste à démontrer.

UEWandercraft (France) développe des exosquelettes humanoïdes à interaction physique patient-robot ; ce module d'estimation d'effort sans capteur dédié pourrait, s'il est validé hors laboratoire, réduire les coûts matériels et améliorer la sécurité de contact en rééducation.

RecherchePaper
1 source
Les robots chinois s'imposent dans la vie réelle, du nettoyage à la régulation du trafic
97SCMP Tech 

Les robots chinois s'imposent dans la vie réelle, du nettoyage à la régulation du trafic

En Chine, les robots humanoïdes et de service quittent les laboratoires pour s'intégrer dans des environnements opérationnels réels, un virage visible depuis le début de 2025. En mars, une offre de nettoyage a été lancée sur 58.com, plateforme chinoise d'annonces équivalente à LeBonCoin, associant un robot à un technicien humain pour des interventions à domicile. Au-delà du ménage, des robots sont désormais déployés pour réguler la circulation routière et intervenir dans des ateliers industriels à risque, là où l'exposition humaine est problématique, soudure, manipulation de produits chimiques, environnements haute température. Ce glissement du POC vers le déploiement opérationnel est structurellement significatif pour le secteur. Il signale que l'écart "demo-to-reality" commence à se résorber dans des cas d'usage à périmètre contrôlé : tâches répétitives, environnements semi-structurés, supervision humaine maintenue. Pour les intégrateurs B2B, cela ouvre une fenêtre concrète sur des ROI calculables, à condition que les cycles de maintenance et les taux d'erreur en conditions réelles soient publiés, ce que les annonces chinoises ne détaillent pas encore systématiquement. La Chine a inscrit la robotique incarnée comme priorité nationale dans son plan industriel 2025, avec des financements étatiques directs vers des acteurs comme Unitree, UBTECH et Fourier Intelligence. Face à Figure AI (Figure 02), Boston Dynamics (Atlas) et Tesla (Optimus Gen 2) côté américain, Pékin mise sur le déploiement massif et rapide plutôt que sur la performance en vitrine. Les prochaines étapes probables : extension des services 58.com à d'autres villes, et multiplication des pilotes industriels dans la logistique et la maintenance lourde.

UELa montée en puissance du déploiement opérationnel des robots chinois (Unitree, UBTECH, Fourier) accentue la pression concurrentielle indirecte sur les fabricants et intégrateurs européens, sans impact direct immédiat sur la France ou l'UE.

Chine/AsieOpinion
1 source
L'art de traverser le gouffre : quand une startup est-elle prête pour l'adoption par les entreprises ?
98Robotics Business Review 

L'art de traverser le gouffre : quand une startup est-elle prête pour l'adoption par les entreprises ?

Figure AI a annoncé avoir atteint un rythme de production d'un robot humanoïde par heure dans son usine BotQ, située dans la baie de San Francisco, soit une multiplication par 24 du débit en moins de 120 jours. La société revendique la livraison de plus de 350 unités de troisième génération (Figure 03), la fabrication de plus de 9 000 actionneurs et 500 packs batterie, avec 150 postes de travail en réseau et plus de 50 stations de contrôle qualité en ligne de production. En parallèle, Flex -- fabricant texan de composants électroniques -- a annoncé le déploiement de robots de Teradyne Robotics dans l'ensemble de ses sites de production mondiaux, en combinant les cobots Universal Robots (UR) et les AMR (robots mobiles autonomes) de Mobile Industrial Robot (MiR), deux filiales de Teradyne. Celle-ci a par ailleurs publié ses résultats du premier trimestre 2026 : 91 millions de dollars de chiffre d'affaires, quatrième trimestre consécutif de croissance après deux vagues de licenciements liées à des baisses de revenus en 2023 et 2024. Du côté des distinctions, l'association A3 a remis les prix Engelberger 2026 à Hiroshi Fujiwara, directeur exécutif de la Japan Robot Association (JARA) depuis 2009, et à Robert Little, cofondateur d'ATI Industrial Automation en 1989, qui a fait passer la société de 1 million à plus de 100 millions de dollars de revenus en devenant un acteur mondial des changeurs d'outils robotiques et des capteurs force/couple. Le chiffre de 24x de gain de débit chez Figure AI est spectaculaire, mais il convient de le lire avec précaution : la société communique sur des volumes de production, non sur des déploiements clients ou des contrats signés -- la distinction entre "fabriqué" et "opérationnel chez un client" reste floue dans ce communiqué. Cela dit, atteindre un robot par heure constitue un vrai seuil industriel si les données sont vérifiées, car la plupart des concurrents humanoïdes fonctionnent encore à l'échelle des dizaines d'unités annuelles. Le partenariat Flex/Teradyne est lui plus concret : Flex étant déjà fournisseur de composants pour UR, ce déploiement interne représente un signal fort de maturité opérationnelle des cobots et AMR dans des environnements de production à haute variabilité. C'est précisément la question que pose Neal Hansch, managing partner de Silicon Foundry et invité de l'épisode 242 du Robot Report Podcast : à quel moment un startup robotique est-il réellement prêt pour l'adoption entreprise, au-delà des démonstrations ? Figure AI a lancé ses premiers prototypes publics en 2023 et son Figure 02 en 2024, avec un financement total dépassant le milliard de dollars. Ses principaux concurrents sur le segment humanoïde incluent Tesla (Optimus Gen 3), Agility Robotics déployé chez Amazon, 1X Technologies, Apptronik, et Physical Intelligence (Pi-0, axé VLA), sans oublier Unitree et Fourier Intelligence côté asiatique. Teradyne, de son côté, cherche à repositionner UR et MiR comme infrastructure de "physical AI" face à la montée des solutions intégrées proposées par des acteurs comme Boston Dynamics (désormais sous Hyundai). La trajectoire de Robert Little chez ATI -- 40 ans d'expérience, croissance organique de 100x sur les end-effectors -- rappelle que les composants critiques de la chaîne robotique peuvent générer une valeur durable bien au-delà des intégrateurs systèmes.

UELe déploiement global de Universal Robots (UR) et MiR par Flex valide la maturité opérationnelle de ces deux marques danoises (filiales Teradyne) dans des environnements industriels à haute variabilité, renforçant leur position concurrentielle sur le marché européen des cobots et AMR face aux solutions intégrées émergentes.

HumanoïdesActu
1 source
Multiplexeur mécanique à embrayage électrostatique avec capacité de force accrue
99arXiv cs.RO 

Multiplexeur mécanique à embrayage électrostatique avec capacité de force accrue

Une équipe de chercheurs a publié sur arXiv (réf. 2501.08469) les résultats d'un système de transmission à embrayage électrostatique à cabestan, conçu pour le multiplexage mécanique d'actionneurs robotiques. Le principe : un seul moteur contrôle plusieurs articulations via des embrayages qui engagent ou désengagent sélectivement les tendons. Démontré sur une main robotique à quatre degrés de liberté (DoF) à entraînement par tendons, le système atteint des forces de sortie allant jusqu'à 212 N, multiplie la résistance en prise verticale par 4,09, et porte la capacité de charge horizontale à 111,2 N. Ce dernier chiffre constituerait un record parmi les mains robotiques à cinq doigts entraînées par tendons, selon les auteurs. L'architecture supporte deux modes : SISO (une entrée, une sortie) pour le contrôle séquentiel joint par joint, et SIMO (une entrée, plusieurs sorties) pour l'activation simultanée de plusieurs articulations depuis un seul moteur. Ces résultats ont des implications directes pour la conception de mains humanoïdes et de préhenseurs industriels à haute dextérité. Le principal goulot d'étranglement des systèmes multi-DoF réside dans l'obligation de dédier un moteur à chaque articulation, ce qui alourdit la masse embarquée, augmente la consommation et complique la gestion thermique. Les solutions d'embrayage existantes souffraient soit d'un encombrement excessif, soit d'un plafond de force trop bas, soit de l'impossibilité de piloter plusieurs sorties simultanément. Le fait que ce système SIMO autorise une commande multi-joint synchrone depuis un seul moteur tout en dépassant 100 N en charge horizontale remet en question l'hypothèse que multiplexage rime nécessairement avec compromis en force. Le multiplexage mécanique n'est pas nouveau : des approches pneumatiques, hydrauliques et magnétiques ont été explorées, chacune butant sur des contraintes de gabarit ou de durabilité. L'embrayage électrostatique à cabestan exploite les forces d'adhérence entre surfaces chargées pour bloquer ou libérer la transmission sans pièces mobiles complexes, ce qui réduit théoriquement l'usure et le bruit d'actionnement. Ce développement arrive dans un contexte de forte compétition autour de la dextérité manuelle humanoïde : Figure (Figure 03), Tesla (Optimus Gen 3), Agility Robotics et 1X Technologies investissent massivement dans ce domaine, et toute réduction du nombre d'actionneurs sans perte de force représente un avantage de masse et de coût significatif. Les prochaines étapes naturelles concerneront la validation en durée de vie prolongée et l'intégration dans une main complète cinq doigts à l'échelle préindustrielle.

RecherchePaper
1 source
Un robot humanoïde chinois grandeur nature avec 18 000 capteurs maîtrise 115 degrés de liberté
100Interesting Engineering 

Un robot humanoïde chinois grandeur nature avec 18 000 capteurs maîtrise 115 degrés de liberté

Kinetix AI, une entreprise de recherche en IA basée à Shenzhen, a dévoilé KAI, un robot humanoïde de taille réelle mesurant 173 cm pour 70 kg. Le robot affiche 115 degrés de liberté (DoF) au total, dont 72 concentrés dans les mains, soit 36 DoF par main combinant 22 articulations actives à commande précise et 14 articulations passives jouant le rôle d'amortisseurs mécaniques. KAI peut se déplacer à 5 km/h, soulever jusqu'à 20 kg, et fonctionne 4 heures par charge grâce à une batterie semi-solide de 1,7 kWh. Sa peau tactile synthétique embarque 18 000 points de capteurs capables de détecter des forces à partir de 0,1 newton, permettant une manipulation haptic-aware en temps réel. Le prix annoncé est inférieur à 40 000 dollars, avec une production en série prévue pour fin 2026. Il s'agit pour l'instant d'une annonce avec démonstration vidéo, sans déploiement commercial confirmé. Le nombre de degrés de liberté des mains est la donnée qui retient l'attention des intégrateurs : la majorité des humanoïdes actuels en compétition (Figure 03, Tesla Optimus Gen 3, Agility Digit) plafonnent à 20-30 DoF manuels, rendant la préhension d'objets complexes ou fragiles difficile à fiabiliser. Les 36 DoF par main de KAI, couplés aux 18 000 capteurs tactiles, visent directement ce goulot d'étranglement. Si les performances annoncées se confirment hors conditions de labo, cela représente un argument sérieux pour les cas d'usage de tri, d'assemblage fin et d'interaction service. Le choix de la batterie semi-solide mérite également d'être noté : en réduisant le risque d'emballement thermique par rapport aux cellules Li-ion classiques, Kinetix adresse un frein réel au déploiement en environnement humain. La cible déclarée reste le service (retail, conciergerie, assistance domicile) et non l'industrie lourde, ce qui situe KAI dans la même catégorie commerciale que Sanctuary AI ou Apptronik. Kinetix AI est une structure relativement peu connue hors de Chine, opérant dans un écosystème humanoïde domestique qui comprend des acteurs déjà bien financés comme Unitree (G1, H1), DEEP Robotics et Fourier Intelligence. Pour entraîner KAI, la société a développé un dispositif portable baptisé KAI Halo, permettant à des opérateurs humains de générer des données d'entraînement lors de tâches quotidiennes via capture vidéo première personne, mouvements corporels et données spatiales. L'architecture d'intelligence repose sur un "World Model" à trois couches (base, action, évaluation) intégrant une simulation prédictive avant exécution de mouvement, approche cohérente avec les tendances actuelles en Physical AI (pi0 de Physical Intelligence, GR00T N2 de NVIDIA). La prochaine étape structurante sera la confirmation de pilotes industriels ou de partenariats distributeurs pour valider la transition du prototype vers le produit livrable.

Chine/AsieOpinion
1 source