Aller au contenu principal
Un cerveau unique pour tout gérer : la Chine développe un modèle d'IA unifié pour la robotique multi-tâches complexe
Chine/AsieInteresting Engineering6sem

Un cerveau unique pour tout gérer : la Chine développe un modèle d'IA unifié pour la robotique multi-tâches complexe

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

La société chinoise ShengShu Technology a présenté Motubrain, un modèle d'IA unifié conçu pour servir de cerveau généraliste aux robots, intégrant perception, raisonnement, prédiction et action dans un seul système. Le modèle affiche un score de 63,77 sur le benchmark WorldArena et une moyenne de 96,0 sur 50 tâches du benchmark RoboTwin 2.0, ce qui en ferait à ce jour le seul modèle à dépasser 95,0 dans des environnements aléatoires. Contrairement aux architectures modulaires classiques qui séparent la perception, la planification et l'exécution en composants distincts, Motubrain traite simultanément flux vidéo, instructions en langage naturel et séquences d'actions via une architecture Mixture-of-Transformers à trois flux. Le modèle est capable d'enchaîner jusqu'à 10 actions atomiques par séquence, contre 2 à 3 pour la plupart des systèmes actuels. L'entraînement repose sur un mélange de vidéos non annotées, de données de simulation et d'enregistrements multi-robots, avec un framework d'actions latentes qui extrait les schémas de mouvement directement depuis ces entrées, réduisant la dépendance aux jeux de données labellisés. ShengShu indique que le modèle est déjà utilisé dans des programmes d'entraînement actifs couvrant des environnements industriels, commerciaux et domestiques, avec des partenariats annoncés avec Astribot, SimpleAI et Anyverse Dynamics.

L'annonce signale une tentative de rupture avec l'approche dominante en robotique, qui consiste à assembler des modules spécialisés (vision, planification, contrôle) développés séparément. Un modèle unifié capable de gérer en continu la boucle perception-action représente un avantage potentiel pour les intégrateurs industriels : moins de friction entre sous-systèmes, une mise à jour centralisée, et une meilleure capacité d'adaptation à des tâches non vues lors de l'entraînement. Le fait démontré en test interne, selon lequel un robot peut détecter l'échec d'une préhension et réessayer sans avoir été entraîné spécifiquement sur ce scénario, illustre une forme de robustesse comportementale qui reste un défi ouvert pour les systèmes modulaires. Les scores sur RoboTwin 2.0 sont notables, mais les conditions précises du benchmark (variété des tâches, comparabilité entre laboratoires) méritent un regard critique : les résultats en simulation ne se transfèrent pas toujours au déploiement terrain. La capacité à maintenir de meilleures performances que les systèmes concurrents à mesure que la complexité des tâches et le volume de données augmentent suggère un bon passage à l'échelle, point clé pour des déploiements industriels à grande variété.

ShengShu Technology s'est d'abord fait connaître via Vidu, sa plateforme de génération vidéo, dont les données à grande échelle alimentent désormais Motubrain pour apprendre la physique du monde réel. Fondée par Jun Zhu, professeur à l'Université Tsinghua, la société a levé 293 millions de dollars en Série B menée par Alibaba Cloud. Sur le marché des modèles cérébraux pour robots polyvalents, elle se positionne face à des acteurs comme Physical Intelligence (Pi-0, San Francisco), NVIDIA avec GR00T N2, et côté chinois, Agibot et Unitree. Le lancement de Motubrain intervient dans un contexte de compétition accélérée autour des modèles VLA (Vision-Language-Action) capables de généralisation multimodale. Les prochaines étapes annoncées incluent l'extension des partenariats industriels et le déploiement sur davantage de plateformes robotiques, sans calendrier précis communiqué.

À lire aussi

Le nouveau robot humanoïde chinois rejoint des agents pour gérer les tâches de voirie
1Interesting Engineering 

Le nouveau robot humanoïde chinois rejoint des agents pour gérer les tâches de voirie

La ville de Shanghai a lancé en mai 2026 le premier programme pilote chinois d'application du droit urbain associant agents municipaux et robot humanoïde dans un espace public. Le déploiement se déroule dans le quartier d'innovation en IA de Zhangjiang, dans l'arrondissement de Pudong, et met en scène le Lingxi X2, robot humanoïde développé par AgiBot, entreprise shanghaïenne fondée en 2023. Le dispositif repose sur une chaîne tripartite : des drones de surveillance identifient en temps réel les infractions commises par des commerçants de rue et transmettent l'information aux agents de patrouille et au Lingxi X2. Le robot se charge ensuite des interactions répétitives à faible valeur décisionnelle, à savoir expliquer les réglementations de voirie, les obligations des exploitants de commerces en façade, et répondre aux questions des marchands. Les agents humains conservent l'intégralité du pouvoir d'évaluation juridique et d'exécution des sanctions. AgiBot décrit la machine comme un "assistant intelligent" et non comme un remplaçant, une précision qui, dans ce contexte politique, est autant un positionnement commercial qu'une garantie opérationnelle. Ce que ce déploiement teste concrètement, c'est la capacité des systèmes d'IA incarnée à tenir un rôle de contact public structuré, avec un corpus de connaissances réglementaires consultable en temps réel, dans un environnement non contrôlé. Pour les intégrateurs et les décideurs en charge de services publics, le cas d'usage est délibérément choisi pour son haut volume de tâches répétitives et son faible risque décisionnel : le robot ne verbalise pas, ne sanctionne pas, n'interprète pas. Il informe. Pan Weijia, responsable de Pudong ayant supervisé l'opération, a explicitement indiqué que l'évaluation portera sur les performances pratiques plutôt que sur le simple volume de déploiement, ce qui signale une approche plus mesurée que le discours habituel sur la scalabilité. Pan Helin, membre du comité d'experts du ministère de l'Industrie et des Technologies de l'Information, a qualifié le pilote de "jalon majeur" dans la commercialisation de l'IA incarnée en administration publique, avec l'objectif affiché de passer des robots capables de "se déplacer" à des robots capables de "travailler efficacement". AgiBot a été fondé en 2023 et s'est positionné rapidement sur le segment des humanoïdes à usage professionnel, avec le Lingxi X2 comme produit phare pour les environnements semi-publics. L'entreprise s'inscrit dans un écosystème chinois d'humanoïdes très dense, qui inclut Unitree (G1, H1), Fourier Intelligence (GR-1), et dans une moindre mesure les ambitions de UBTECH et de Kepler. À l'international, les comparaisons les plus directes sont Figure (01, 02), 1X Technologies (NEO), et Boston Dynamics (Atlas), tous positionnés sur des environnements industriels ou logistiques plutôt que sur l'espace public. Le vrai enjeu du pilote de Pudong n'est pas la performance du robot dans une démonstration maîtrisée, mais sa robustesse sur la durée dans un contexte d'interactions non scénarisées avec des usagers non entraînés. Les prochaines étapes annoncées par Pan Helin visent une extension à d'autres scénarios de service public, sans échéance précisée.

UESignal stratégique indirect pour les décideurs européens de la robotique de service public : la Chine ouvre un précédent réglementaire et opérationnel pour le déploiement d'humanoïdes en espace civil non contrôlé, domaine où aucun acteur FR/EU n'est encore positionné.

Chine/AsieOpinion
1 source
AGIBOT organise le World Challenge 2026 pour évaluer les modèles d'IA sur des tâches réelles
2The Robot Report 

AGIBOT organise le World Challenge 2026 pour évaluer les modèles d'IA sur des tâches réelles

AGIBOT Innovation Technology, également connue sous le nom de Zhiyuan Robotics, a organisé la AGIBOT World Challenge 2026 en marge de l'ICRA 2026 à Vienne, réunissant 526 équipes de recherche et d'entreprises issues de 27 pays autour de deux pistes compétitives en IA incarnée : "Reasoning to Action" (R2A) et "World Model" (WM). La finale hors ligne s'est déroulée sur le robot humanoïde AGIBOT G2, avec des évaluations standardisées via les benchmarks EWMBench et Genie Sim 3.0. Dans la piste R2A, qui élargit l'évaluation de la simple exécution motrice à la compréhension d'environnement et à la planification de tâches, c'est l'équipe PrismBot de vivo qui a remporté le championnat avec 43,47 points, devant RP-VLA de Shanghai RoboParty (35,66 points) et GreenVLA de la Russie (33,19 points). Dans la piste WM, NeoVerse-ABot, équipe conjointe de l'Institut d'Automatisation de l'Académie des Sciences de Chine et du laboratoire Amap CV, a décroché la première place. Plus de 100 équipes ont dépassé le score de référence officiel, avec des participants issus de la Tsinghua University, de l'USTC, de l'UC San Diego, d'Alibaba et du Sber Robotics Center russe. La signification industrielle de cet événement tient moins aux classements qu'au format d'évaluation lui-même : l'abandon progressif des scores de simulation au profit de tests en boucle fermée sur robots réels, avec des métriques reproductibles et standardisées. Pour les intégrateurs et les décideurs B2B, c'est un signal que le secteur commence à construire des référentiels comparables entre systèmes -- un prérequis pour toute contractualisation sérieuse. La piste "World Model", centrée sur la prédiction de changements physiques et la modélisation d'interactions à partir d'entrées sensorielles, teste directement la capacité des VLA (Vision-Language-Action models) à généraliser hors distribution, y compris le transfert zéro-shot et l'adaptation aux perturbations. Le benchmark supermarché co-développé avec Dexmal va plus loin en intégrant des interactions physiques non idéales -- chutes d'objets, échecs de préhension -- et impose la navigation autonome, le picking et le placement sous contraintes réelles (hauteurs de rayonnage variables, placement aléatoire des articles), contrôlés via API distante. C'est une démarche de validation orientée déploiement, pas de démonstration. AGIBOT, fondée à Shanghai, s'est imposée comme l'un des acteurs centraux de l'écosystème robotique humanoïde chinois, aux côtés d'Unitree, de Fourier Intelligence et de l'initiative GR00T de NVIDIA. Son dataset open-source AGIBOT WORLD, utilisé pour entraîner les modèles de la piste WM, constitue un levier de standardisation communautaire similaire à ce qu'Open X-Embodiment représente côté américain. La compétition s'appuie sur Genie Sim 3.0 pour l'évaluation de capacités couvrant la compréhension du langage, le raisonnement spatial et les compétences atomiques de manipulation. Dans la course mondiale à la robotique humanoïde commerciale -- où Boston Dynamics, Figure AI, Agility Robotics et 1X Technologies avancent leurs propres plateformes -- AGIBOT positionne le G2 comme un banc d'essai de référence pour la communauté académique et industrielle, avec une stratégie d'écosystème ouverte qui rappelle davantage un hub de recherche qu'une pure offre produit.

Chine/AsieOpinion
1 source
Une nouvelle main robotique chinoise combine un actionnement hybride pour améliorer la préhension
3Interesting Engineering 

Une nouvelle main robotique chinoise combine un actionnement hybride pour améliorer la préhension

La startup chinoise Xynova a dévoilé la Flex 2, sa main robotique de deuxième génération, conçue pour équiper les robots humanoïdes de capacités de manipulation proches de celles de la main humaine. Le système embarque 23 degrés de liberté pour un poids de 400 grammes, et atteint une cadence de deux extensions de poing par seconde. Sa répétabilité est annoncée à ±0,1 mm, avec une précision de contrôle de force descendant à 0,05 newtons, ce qui lui permet de saisir des objets fragiles ou de forme irrégulière sans les endommager. La charge utile en préhension atteint 12 kg en pic et 4 kg en continu. Xynova revendique un score parfait au test de Kapandji, référence clinique pour évaluer l'opposition du pouce, ainsi qu'une résistance à la poussière, aux chutes et aux impacts compatible avec des millions de cycles opérationnels. La main intègre un système de perception multi-modal comprenant capteurs tactiles, proprioception et un module de détection de glissement, que l'entreprise qualifie de "cervelet artificiel" adaptatif. La Flex 2 illustre une tendance de fond dans la conception des mains robotiques : l'hybridation des modes d'actionnement. Le système combine des tendons à câbles, qui apportent compliance et légèreté, avec une actuation directe qui fournit le couple nécessaire aux tâches de contact précis. Ce compromis cherche à surmonter l'un des obstacles persistants du secteur : la manipulation dite "au dernier centimètre", soit la capacité à exécuter des gestes contact-riches hors d'environnements contrôlés. Xynova a également repositionné la caméra du système de vision depuis la paume vers le poignet, ce qui réduit les problèmes d'occlusion lors de la saisie et améliore la qualité des données collectées pour entraîner des pipelines VLA (vision-language-action) utilisés dans les systèmes d'IA incarnée. C'est une décision architecturale modeste en apparence, mais potentiellement significative pour quiconque développe des politiques d'imitation learning sur données visuelles. Xynova s'inscrit dans une vague de startups chinoises spécialisées dans la manipulation dextre, un segment en croissance rapide depuis que les grands intégrateurs humanoïdes comme Figure AI (Figure 03), Tesla (Optimus Gen 3) ou Physical Intelligence (Pi-0) ont montré les limites des préhenseurs rigides industriels sur des tâches non structurées. Le précédent modèle de Xynova, la Flex 1, affichait 25 DOF, 380 grammes et une force d'extrémité de doigt de 20 N pour une charge de 30 kg, positionnant déjà la marque sur le segment haute performance. Avec la Flex 2, l'entreprise pivote explicitement vers la fidélité de contrôle lors des interactions physiques plutôt que vers les seules métriques hardware. Aucun prix public ni calendrier de livraison commerciale n'ont été communiqués à ce stade : la Flex 2 reste pour l'instant une annonce produit sans déploiement confirmé.

Chine/AsieActu
1 source
L'ex-PDG de Kepler Robotics lance Sota Unlimited, misant sur un cerveau robotique pour les marchés étrangers
4Pandaily 

L'ex-PDG de Kepler Robotics lance Sota Unlimited, misant sur un cerveau robotique pour les marchés étrangers

Hu Debo, ancien PDG de Kepler Robotics, a annoncé le 14 mai 2026 la création de sa deuxième entreprise dans le domaine de l'IA incarnée : Sota Unlimited. Contrairement à Kepler, qui misait sur des robots humanoïdes bipèdes complets destinés à des scénarios industriels, Sota Unlimited se concentre exclusivement sur la couche logicielle et cognitive, ce que l'industrie appelle le «cerveau» du robot. La société développe des world action models, des systèmes VLA (Vision-Language-Action) multimodaux, et des infrastructures de collecte de données. Elle prévoit de présenter ses capacités complètes cet été, avec des démonstrations en laboratoire couvrant l'ensemble du processus commercial, ainsi que son système d'exploitation robotique baptisé Physica-Claw. Aucun chiffre de performance, prix ou volume de déploiement n'a été communiqué à ce stade. Ce pivot de la machine complète vers le «cerveau seul» repose sur une hypothèse stratégique précise : le principal goulet d'étranglement de la robotique incarnée n'est pas mécanique mais cognitif, soit la capacité à comprendre le contact, le mouvement, l'espace et la physique, et non simplement percevoir l'environnement par vision. Pour les intégrateurs et les fournisseurs de plateformes robotiques internationaux, cela ouvre la possibilité d'acquérir une couche d'intelligence sans développer en interne un modèle VLA compétitif. La stratégie de fournisseur de «cerveau» pour constructeurs tiers pourrait réduire les barrières à l'adoption, à condition que les performances se confirment en conditions réelles et pas uniquement en laboratoire contrôlé. Hu Debo avait co-fondé Kepler Robotics en 2023, au début de l'accélération de la course aux humanoïdes en Chine. En avril 2026, Kepler avait levé un tour A++ d'un milliard de yuans, s'imposant comme l'une des références nationales dans les scénarios industriels. Sota Unlimited prend un chemin radicalement différent : là où la quasi-totalité des entreprises chinoises de robots humanoïdes ciblent le marché domestique, Sota vise les marchés internationaux dès son lancement, se positionnant comme fournisseur B2B pour les constructeurs robotiques étrangers. Les concurrents directs sur ce créneau incluent Physical Intelligence (Pi-0) aux États-Unis et, dans une moindre mesure, les laboratoires académiques européens travaillant sur des architectures VLA généralisables. Les premières démonstrations commerciales complètes sont attendues pour l'été 2026.

UESota Unlimited cible explicitement les marchés internationaux dont l'Europe, offrant aux constructeurs robotiques européens un fournisseur potentiel de couche VLA clé-en-main, mais aucun partenariat ni déploiement EU n'est confirmé à ce stade.

Chine/AsieOpinion
1 source