Dossier Figure — page 2

683 articles · page 2 sur 14

Figure, le constructeur de robots humanoïdes le plus capitalisé : Figure 02 et 03, modèle Helix VLA, déploiements BMW, partenariats avec OpenAI puis indépendance.

51Pandaily Chine/AsieActu

Tencent Robotics X en open source de trois modèles fondation incarnés : le scientifique en chef Zhang Zhengyou explique l'architecture cérébrale à trois couches pour la vitesse de réaction des robots

Tencent Robotics X Laboratory a présenté au salon WAIC 2026 trois modèles fondationnels d'intelligence incarnée, désormais disponibles en open source : Hy-Embodied-VLM-1.0, dédié à la compréhension spatiale et des scènes, Hy-Embodied-RxBrain-1.0, chargé de la planification cognitive, et Hy-Embodied-VLA-0.5, qui traduit des objectifs de haut niveau en commandes motrices continues. Le chercheur en chef Zhang Zhengyou a expliqué que cette architecture à trois couches répond à un problème mal traité par les approches VLA actuelles : le monde physique fonctionne à plusieurs échelles temporelles, et l'intelligence robotique doit donc opérer à des fréquences différentes selon la tâche. Cette conclusion découle d'un échec concret : une tentative de faire tourner des capacités robotiques sur OpenClaw a produit des dizaines de secondes de latence, alors qu'un délai cognitif de seulement 2 à 3 secondes est déjà problématique pour un robot physique. Tencent a précisé que Hy-Embodied-VLA est entré en phase de test en production dans une usine de produits chimiques ménagers, sur des lignes d'assemblage multi-références à petits lots, avec un temps de cycle par pièce inférieur à 6 secondes et une capacité d'adaptation à une nouvelle référence après seulement 8 heures de collecte de données et de réentraînement. Ce déploiement en usine, avec objets positionnés aléatoirement, éclairage variable et interruptions de production, marque une bascule notable : Tencent affirme viser un taux d'échec quasi nul en conditions réelles plutôt qu'un score de démonstration, Zhang Zhengyou allant jusqu'à qualifier de "valeur quasi nulle" une démo qui obtiendrait 80 à 90 points sans déploiement effectif, une formule qui mérite d'être lue comme une critique implicite de nombreuses vitrines du secteur plutôt qu'un résultat mesuré indépendamment. Pour les intégrateurs et décideurs industriels, l'apport le plus concret est ailleurs, dans Hy-Embodied-RxBrain : au lieu de faire communiquer les modules par du texte, comme le faisaient les précédents systèmes Tairos, ce modèle "imagine" un état visuel du monde après chaque sous-tâche, ce qui règle le goulot d'étranglement du langage pour décrire des relations spatiales. Tencent le présente prudemment comme un modèle cognitif incarné plutôt qu'un véritable "world model", le secteur n'ayant pas encore convergé vers une architecture unifiée en la matière. Cette annonce s'inscrit dans la course mondiale aux modèles vision-langage-action, aux côtés d'acteurs comme Tesla, Figure AI, Physical Intelligence ou NVIDIA, dans un contexte où l'écart entre démonstration et exploitation industrielle reste le principal point de friction. En ouvrant l'ensemble de sa pile Tairos, incluant les trois modèles, Tencent met à disposition des développeurs et industriels une architecture pensée pour la fréquence, issue directement de ses propres échecs et itérations, sans toutefois communiquer de calendrier précis pour un déploiement à plus grande échelle au-delà du site pilote chimique.

Dossier Figure — page 2

Tencent Robotics X en open source de trois modèles fondation incarnés : le scientifique en chef Zhang Zhengyou explique l'architecture cérébrale à trois couches pour la vitesse de réaction des robots

ModPack : une interface de téléopération extensible pour la manipulation mobile bimanuelle

Robot réceptionniste à tête humanoïde articulée pour interaction humaine naturelle

Robotique : les véritables gagnants seront-ils les fournisseurs de composants ?

Action QFormer : structuration des représentations guidée par la supervision des actions dans les modèles vision-langage-action

China vise 1 000 robots humanoïdes Iron par mois avant un déploiement mondial en 2027

Xiaomi déploie ses robots sur la chaîne de production automobile : opérations flexibles sur pièces réussies

NVIDIA explique comment évaluer les politiques robotiques polyvalentes en conditions réelles

FlowDAgger : adaptation en boucle humaine des politiques génératives de robots dans l'espace latent

« NEO, le robot humanoïde, reçoit de nouvelles mains à 25 degrés de liberté pour construire des LEGO et attraper des balles »

LingBot-Vision d'Ant Group : 12 premières mondiales, un modèle de 1,1 milliard de paramètres bat DINOv3 (7 milliards)

Humanoid : l'apprentissage par renforcement KinetIQ Ascend atteint une dextérité proche de l'humain

Robots humanoïdes en première ligne : du salon d'exposition à l'usine comme employés vedettes

UBTech déploie ses robots humanoïdes pour contrôler les foules à une frontière internationale chinoise très fréquentée

Top 10 des avancées en robotique de juin 2026

Un robot humanoïde actif 24h/24 permet à quiconque de lui parler en ligne

Chine : UBTech présente un humanoïde à roues pour automatiser les ateliers de production

Le paradoxe de l'accélération : repenser le compromis vitesse-qualité à l'inférence dans les tâches incarnées

Eval-Actions : évaluation fine de la qualité d'exécution en manipulation robotique

AnyBody : contrôle libre du corps entier d'un humanoïde par points-clés arbitraires

X-Morph : des priors de mouvement humain pour l'apprentissage robotique évolutif multi-morphologies

PA-BiCoop : un cadre coopératif principal-auxiliaire pour la manipulation bimanuelle généraliste

Booster Lab : un pipeline centré sur les données pour l'apprentissage de politiques de locomotion humanoïde déployables

Introduction aux représentations d'actions SO(3) en apprentissage par renforcement profond

Lois d'échelle des données en apprentissage par imitation pour la manipulation robotique

Main dextérique de Zhiyuan : 1 milliard de dollars, déjà rentable en 5 mois ; DeepSeek double ses départements

WatchAct : un benchmark de manipulation robotique fondée sur le comportement

HumanoidUMI : relier les démonstrations sans robot à la manipulation corps entier des humanoïdes

L'usine CATL intègre le robot humanoïde de Galbot pour la manutention lourde

NVIDIA Halos for Robotics : la sécurité des robots industriels entre dans une nouvelle ère

Action ControlNet : un adaptateur léger sensible aux délais pour un contrôle asynchrone fluide dans les modèles VLA

PhyGile : génération de mouvements guidée par préfixe physique pour le suivi agile d'humanoïdes généralistes

MuTRAP : trojans à déclencheurs multiples ciblant les systèmes de planification de tâches robotiques

Une entreprise américaine dévoile R-Noid, un robot humanoïde pour les usines, hôtels et entrepôts

Star Dynasty lève plus de 4 milliards de yuans : les robots humanoïdes du professeur de Tsinghua déployés chez SF Express

Bear Robotics acquiert Kinisi Robotics pour renforcer ses capacités d'IA physique

Vidéo : un système robotique atteint 99,5 % de réussite dans le câblage rapide en usine automobile

Apprentissage robotique ludique à base d'agents

Estimation d'état proprioceptive invariante pour robots humanoïdes sur sol non inertiel

Soutien politique et production de masse propulsent les ETF de robots humanoïdes à l'aube d'une phase critique

L'apprentissage de la manipulation dextérique à partir de vidéos humaines du quotidien

Alibaba et ByteDance redoublent d'efforts sur l'IA incarnée : l'apport des géants d'internet à la robotique

Construction et test d'un actionneur robotique DIY

Le secret des robots humanoïdes victorieux en marathon

HumanoidArena : évaluation de l'apprentissage corporel hiérarchique en vue égocentrique

SAPS : autonomie partagée pour orienter la politique en combinant téléopération et VLA pré-entraîné

MPC d'impédance avec estimation des perturbations pour le contrôle de main dextérique

APT : le pré-entraînement par expertise d'action améliore la généralisation des politiques VLA aux nouvelles instructions

FACTR 2 : la détection de force externe sur bras robotiques standard améliore l'apprentissage des politiques

DAM-VLA : modèle vision-langage-action multimodal asynchrone et découplé