Chine/Asie36Kr2h

Marché de l'IA physique encore ouvert : une entreprise chinoise propose l'approche 'edge-native' comme nouvelle solution

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Au premier trimestre 2026, les investissements mondiaux dans le Physical AI ont dépassé 6,4 milliards de dollars, avec des levées emblématiques : AMI Labs (1,03 milliard de dollars en seed), World Labs (1 milliard) et le chinois Qianxun Intelligence (4,5 milliards de yuans en quatre tours en mars). C'est dans ce contexte qu'Om AI, une startup chinoise, a présenté du 27 au 29 juin 2026 une suite de trois modèles, VLX-Flow, VLX-Seek et VLX-Go, positionnée non pas sur la manipulation dextère ni la planification longue portée, mais sur la perception visuelle continue, la localisation spatiale précise et la navigation autonome. VLX-Flow utilise une attention linéaire (Linear Attention) couplée à une double mémoire (cache visuel et carryover textuel) pour ingérer le flux vidéo en continu, à la différence du paradigme classique qui traite des images isolées. VLX-Seek substitue la génération de coordonnées par une référence de région, fournissant des ancres spatiales à précision millimétrique. VLX-Go produit directement des trajectoires de waypoints exécutables via prédiction court-terme, apprentissage hors-ligne et optimisation RL en ligne.

L'approche d'Om AI soulève un angle mort que les architectures VLA et world model dominantes n'ont pas encore résolu : dans les VLA mainstream, le tronc LLM absorbe plus de 90 % des ressources de calcul et des données, reléguant la tête d'action en composant chroniquement sous-entraîné. Les world models, censés combler ce déficit via la simulation physique, butent sur la rareté des données haute qualité à l'échelle requise. Or, la majorité des terminaux physiques déployés, drones en environnement GPS-dégradé, robots quadrupèdes, lunettes AR, terminaux d'inspection industrielle, n'ont pas besoin de mains dextères : ils ont besoin de localisation fiable et de perception continue. En repositionnant le problème sur la vision edge-native plutôt que sur la génération d'actions complexes, Om AI cible un segment plus large et potentiellement plus rapidement déployable que les humanoïdes, à condition que ses benchmarks se confirment hors des vidéos de démonstration sélectionnées.

NVIDIA a présenté au GTC 2026 Alpamayo (VLA propriétaire) et Isaac GR00T N1.6 (VLA open-source pour humanoïdes) ; Xiaopeng a dévoilé X-Foresight au CVPR 2026 ; Google DeepMind avait publié Genie 3 en août 2025. La Beijing Academy of AI (BAAI) recense quatre routes de world models sans consensus industriel : centrée langage (Gemini 3), pixel (Sora), 3D (World Labs Marble de Fei-Fei Li) et représentation visuelle (V-JEPA de Yann LeCun). Les projections de marché divergent fortement : Future Markets table sur 383 milliards de dollars en 2026 croissant à 32 600 milliards en 2040, tandis que Coatue Management anticipe au moins 6 000 milliards, soit 50 % de plus que le digital AI. Om AI n'a pas encore communiqué de clients industriels nommés ni de volumes de déploiement pour sa suite VLX, ce qui reste la prochaine étape déterminante.

Dans nos dossiers

IA physique & VLA NVIDIA GR00T World models

À lire aussi

1Interesting Engineering

Une nouvelle main robotique chinoise combine un actionnement hybride pour améliorer la préhension

La startup chinoise Xynova a dévoilé la Flex 2, sa main robotique de deuxième génération, conçue pour équiper les robots humanoïdes de capacités de manipulation proches de celles de la main humaine. Le système embarque 23 degrés de liberté pour un poids de 400 grammes, et atteint une cadence de deux extensions de poing par seconde. Sa répétabilité est annoncée à ±0,1 mm, avec une précision de contrôle de force descendant à 0,05 newtons, ce qui lui permet de saisir des objets fragiles ou de forme irrégulière sans les endommager. La charge utile en préhension atteint 12 kg en pic et 4 kg en continu. Xynova revendique un score parfait au test de Kapandji, référence clinique pour évaluer l'opposition du pouce, ainsi qu'une résistance à la poussière, aux chutes et aux impacts compatible avec des millions de cycles opérationnels. La main intègre un système de perception multi-modal comprenant capteurs tactiles, proprioception et un module de détection de glissement, que l'entreprise qualifie de "cervelet artificiel" adaptatif. La Flex 2 illustre une tendance de fond dans la conception des mains robotiques : l'hybridation des modes d'actionnement. Le système combine des tendons à câbles, qui apportent compliance et légèreté, avec une actuation directe qui fournit le couple nécessaire aux tâches de contact précis. Ce compromis cherche à surmonter l'un des obstacles persistants du secteur : la manipulation dite "au dernier centimètre", soit la capacité à exécuter des gestes contact-riches hors d'environnements contrôlés. Xynova a également repositionné la caméra du système de vision depuis la paume vers le poignet, ce qui réduit les problèmes d'occlusion lors de la saisie et améliore la qualité des données collectées pour entraîner des pipelines VLA (vision-language-action) utilisés dans les systèmes d'IA incarnée. C'est une décision architecturale modeste en apparence, mais potentiellement significative pour quiconque développe des politiques d'imitation learning sur données visuelles. Xynova s'inscrit dans une vague de startups chinoises spécialisées dans la manipulation dextre, un segment en croissance rapide depuis que les grands intégrateurs humanoïdes comme Figure AI (Figure 03), Tesla (Optimus Gen 3) ou Physical Intelligence (Pi-0) ont montré les limites des préhenseurs rigides industriels sur des tâches non structurées. Le précédent modèle de Xynova, la Flex 1, affichait 25 DOF, 380 grammes et une force d'extrémité de doigt de 20 N pour une charge de 30 kg, positionnant déjà la marque sur le segment haute performance. Avec la Flex 2, l'entreprise pivote explicitement vers la fidélité de contrôle lors des interactions physiques plutôt que vers les seules métriques hardware. Aucun prix public ni calendrier de livraison commerciale n'ont été communiqués à ce stade : la Flex 2 reste pour l'instant une annonce produit sans déploiement confirmé.

Chine/AsieActu

1 source

2Pandaily

IA incarnée chinoise : une entreprise domine le benchmark RoboArena, devant NVIDIA et Physical Intelligence

Une entreprise chinoise spécialisée en intelligence artificielle incarnée (embodied AI) a décroché la première place du classement RoboArena lors de la conférence NVIDIA GTC Taipei 2026, devançant NVIDIA et Physical Intelligence (PI). Le benchmark RoboArena est conçu pour évaluer des systèmes d'IA robotique sur des tâches physiques réelles variées : manipulation d'objets, navigation mobile et utilisation d'outils complexes. Sa méthodologie inclut des conditions environnementales aléatoires, des perturbations adversariales et des exigences strictes de reproductibilité, ce qui en fait l'un des rares benchmarks difficiles à truquer par overfitting. Fait notable : l'article source ne mentionne pas le nom de cette entreprise, ce qui affaiblit la portée de l'annonce et rend toute vérification indépendante impossible pour l'instant. La solution retenue s'appuie sur une architecture qui intègre étroitement la perception visuelle et le contrôle moteur au niveau du réseau de neurones, permettant une adaptation rapide à de nouveaux environnements avec un fine-tuning minimal. L'entrée de NVIDIA, construite sur sa plateforme Isaac et ses pipelines de simulation-to-real accélérés GPU, ainsi que celle de Physical Intelligence, connue pour ses politiques robotiques généralistes (dont le modèle Pi-0), ont toutes deux été surpassées en score agrégé. Ce résultat conteste l'hypothèse dominante selon laquelle la puissance de calcul brute est le principal levier de performance en embodied AI. Si confirmé, cela suggère que l'innovation architecturale et une utilisation efficace des données réelles peuvent compenser un désavantage de ressources significatif face à des acteurs comme NVIDIA ou PI, qui disposent de budgets compute sans commune mesure. Pour les intégrateurs et décideurs industriels, cela signifie que le marché reste ouvert à des challengers lean, et que la course à la généralisation robotique n'est pas encore jouée par les seuls hyperscalers. La validation par un benchmark tiers réputé représente un argument commercial fort, surtout dans un secteur où les démonstrations en conditions contrôlées sont légion. Il convient cependant de rester prudent : aucune métrique précise (payload, degrés de liberté, temps de cycle, taux de succès par tâche) n'est communiquée dans l'annonce, et les vidéos de démonstration n'ont pas encore été soumises à un audit indépendant. RoboArena a été lancé comme réponse directe aux critiques sur la reproductibilité des benchmarks robotiques, dans un contexte où des acteurs comme Figure AI (Figure 03), Tesla (Optimus Gen 3), Boston Dynamics, 1X Technologies et Physical Intelligence publient des résultats difficiles à comparer. La Chine construit depuis plusieurs années un écosystème embodied AI dense, porté par une base de fabrication hardware mature, un vivier de talents en vision par ordinateur issus des géants technologiques (Baidu, Alibaba, DJI), et un soutien gouvernemental actif à l'industrialisation de l'IA. La prochaine étape logique pour cette entreprise anonyme sera de se nommer publiquement, de publier ses données brutes et d'annoncer des déploiements pilotes en environnement industriel réel pour confirmer que la performance benchmark se traduit en valeur opérationnelle.

UELa compétitivité croissante de l'écosystème chinois en IA incarnée constitue un signal d'alerte indirect pour les industriels et laboratoires européens positionnés sur la robotique généraliste.

Chine/AsieOpinion

1 source

3Pandaily

Moore Threads et Guangyun Intelligence s'associent pour bâtir une base d'IA physique souveraine avec calcul national et simulation

Moore Threads et Guangyun Intelligence ont annoncé un partenariat stratégique, selon le média financier chinois IPO Zaozhidao. L'accord associe les GPU polyvalents de Moore Threads et son cluster de calcul intelligent Kua'e à la plateforme de simulation propriétaire de Guangyun Intelligence, articulée autour d'une approche intégrée "solve-measure-generate" (résolution, mesure, génération). L'objectif commun est de produire à grande échelle des données synthétiques haute-confiance pour le développement de l'IA incarnée (embodied AI). Aucun chiffre de volume de données, de puissance de calcul déployée ni de tarification n'a été communiqué dans l'annonce. Ce partenariat cible un verrou structurel de la robotique humanoïde : la rareté des données physiques réelles, leur coût de collecte, la couverture insuffisante des scénarios, et la difficulté à reproduire de façon stable des processus physiques complexes lors des campagnes de collecte sur robot réel. La synthèse de données de haute qualité s'impose comme voie de contournement, mais elle se heurte à des besoins en calcul en croissance exponentielle liés à l'explosion combinatoire du rendu. Le pipeline proposé, de la trajectoire réelle à la modélisation en simulation puis à l'augmentation de données, ambitionne notamment de résoudre la simulation physique de la préhension de corps souples (flexible body grasping), un défi technique clé pour les applications de manipulation industrielle. L'annonce s'inscrit dans la course chinoise à la souveraineté en IA physique. Moore Threads, fondé en 2020, positionne ses GPU comme alternative domestique aux puces Nvidia dans un contexte de restrictions américaines à l'exportation. Guangyun Intelligence se spécialise dans la simulation pour la robotique incarnée. Ce type de boucle fermée entre calcul souverain et production de données synthétiques robotiques trouve des équivalents directs dans l'écosystème occidental, notamment NVIDIA Isaac Sim, la plateforme open-source Genesis, ou les pipelines internes de Figure AI et Physical Intelligence. La portée réelle de ce partenariat reste à démontrer : l'annonce relève du cadre stratégique, sans déploiement documenté ni résultat public à ce stade.

Chine/AsieOpinion

1 source

4Pandaily

L'industrie robotique chinoise enregistre de multiples avancées dans les humanoïdes et l'IA physique

En l'espace d'une semaine, l'industrie robotique chinoise a enregistré plusieurs jalons concrets. Ubtech Robotics a annoncé que les pré-commandes de son robot humanoïde pleine taille Ubestworld dépassent 5 000 unités sur JD.com, avec une mise en vente simultanée sur Tmall. Dans le segment de l'IA physique, Jiangxing Intelligence a bouclé deux tours de financement stratégiques consécutifs totalisant plusieurs centaines de millions de yuans ; l'entreprise, fondée par Pang Haitian, revendique déjà la rentabilité et déploie ses solutions dans de multiples secteurs industriels. Alibaba a par ailleurs publié la série Qwen-Robot, ses modèles d'IA incarnée, pendant que le constructeur automobile Seres dévoilait son premier robot humanoïde. Sur le segment grand public, la startup ZuzuZoos a finalisé un tour Pre-A de plusieurs dizaines de millions de yuans pour son robot compagnon IA couplant grands modèles de langage et design IP, ciblant les femmes de 18 à 35 ans. Enfin, le ministère chinois de l'Industrie et des Technologies de l'Information (MIIT) a mis en consultation publique des projets de normes techniques pour les robots humanoïdes dans les sous-stations électriques et la fabrication d'électroménager, couvrant évaluation de performance, spécifications après-vente et interconnexion inter-robots. La simultanéité de ces signaux est plus significative que chacun pris isolément. Les 5 000 pré-commandes d'Ubtech, même sans précision de prix ni calendrier de livraison ferme, constituent un indicateur de demande grand public qui dépasse le cadre industriel habituel des humanoïdes, un glissement de marché que peu d'analystes anticipaient à ce stade. Plus structurellement, la publication de normes sectorielles par le MIIT est un accélérateur de déploiement B2B : elle réduit le risque d'évaluation pour les intégrateurs et les donneurs d'ordre industriels, qui n'ont plus à définir leurs propres grilles de qualification. La profitabilité affichée de Jiangxing Intelligence, si elle se confirme, invalide partiellement la thèse selon laquelle l'IA physique à grande échelle est encore trop immature pour générer des revenus récurrents. Du côté de JD Group, l'annonce par le fondateur Liu Qiangdong d'un plan de reconversion pour 700 000 employés col bleu, livreurs inclus, via des accords avec 120 établissements de formation, signale une stratégie de transition sociale anticipée face à l'automatisation, rarement formulée aussi explicitement par un opérateur de cette taille. Ce déferlement s'inscrit dans une dynamique d'écosystème que Pékin cultive depuis plusieurs années : subventions à la R&D robotique, zones pilotes pour l'IA incarnée, et pression réglementaire pour structurer rapidement un marché encore fragmenté. Face à cette accélération, les acteurs occidentaux positionnés sur l'humanoïde, Figure AI avec son robot 03, Tesla avec Optimus Gen 3, Physical Intelligence avec Pi-0, ou NVIDIA avec GR00T N2, maintiennent une avance technologique sur certains benchmarks de manipulation, mais voient l'écart de vitesse de commercialisation se réduire. Aucun acteur français ou européen n'est directement mentionné dans ces développements, bien que Wandercraft, Enchanted Tools ou Pollen Robotics opèrent sur des niches complémentaires (exosquelettes, cobots). Les prochaines étapes à surveiller : les dates de livraison effectives de l'Ubestworld, l'entrée en vigueur des normes MIIT, et les premiers déploiements industriels documentés de Qwen-Robot.

UELa simultanéité des avancées chinoises (normes MIIT, Qwen-Robot, signal de demande grand public Ubtech) accroît la pression concurrentielle sur les acteurs européens du secteur, sans impact direct immédiat sur le marché ou la réglementation en France/UE.

Chine/AsieActu

1 source