Dossier IA physique & VLA

80 articles

L'IA physique : modèles vision-langage-action qui contrôlent des corps robotisés. État de l'art académique (CoRL, RSS) et premières productions industrielles.

Figure 1X Technologies Tesla Optimus Boston Dynamics Unitree AgiBot Apptronik Apollo Agility Robotics — Digit UBTech Fourier Intelligence Sanctuary AI Wandercraft Tous les dossiers →

1SCMP Tech Chine/AsieOpinion

Les avancées de l'IA physique chinoise s'affichent sur les routes, dans les airs et en usine

L'IA physique - la combinaison de machines avancées dotées de "cerveaux" capables d'interagir avec leur environnement - connaît une expansion accélérée en Chine. Des drones de livraison sillonnent désormais les airs au-dessus de Shenzhen, dans le sud du pays, tandis que des robots de livraison empruntent les réseaux de métro urbains. Les premiers véhicules autonomes circulent sur des axes publics, et des robots humanoïdes font leur apparition aussi bien sur les lignes de production industrielles que sur des scènes de spectacle. Cette convergence entre robotique, véhicules autonomes et drones représente un changement structurel dans la façon dont la Chine déploie l'IA au-delà des serveurs : il ne s'agit plus de démos en laboratoire, mais de systèmes en opération réelle dans des environnements non contrôlés. Pour les intégrateurs industriels et les décideurs B2B, cela signifie que le fossé entre prototype et déploiement se réduit concrètement sur plusieurs verticales simultanément, ce qui accroît la pression concurrentielle sur les acteurs occidentaux et japonais du secteur. Ce déploiement s'inscrit dans une stratégie industrielle nationale de long terme, soutenue par des financements publics et une chaîne d'approvisionnement en composants (actionneurs, capteurs, puces) largement localisée. Face à la Chine, les États-Unis misent sur des acteurs comme Figure AI, Agility Robotics ou Boston Dynamics, tandis qu'en Europe, des sociétés comme Enchanted Tools (France) ou Wandercraft restent à des stades de commercialisation plus précoces. Les prochaines étapes chinoises devraient inclure une densification des flottes de drones en zone urbaine et l'extension des corridors de test pour véhicules autonomes.

UELes entreprises françaises comme Enchanted Tools et Wandercraft, encore en phase de commercialisation précoce, subissent une pression concurrentielle croissante face aux déploiements à grande échelle opérés en Chine sur plusieurs verticales simultanément.

Dossier IA physique & VLA

Les avancées de l'IA physique chinoise s'affichent sur les routes, dans les airs et en usine

RedVLA : l'attaque physique des modèles vision-langage-action (VLA)

Robotera lève près de 350 M$ en deux mois et revendique le premier PMF en IA incarnée

Xu Huazhe (破壳机器人) : des robots domestiques opérationnels attendus en Chine d'ici deux ans

Hikrobot : chiffre d'affaires 2025 supérieur à 6,4 milliards de yuans, déploiement accéléré en IA incarnée

De la science-fiction à la réalité : l'avenir de l'IA physique selon le Dr Jan Liphardt

Accenture, Vodafone et SAP testent des robots humanoïdes en entrepôt

Vidéo du vendredi : qui gagne entre un robot et un joueur professionnel de ping-pong ?

XYZ Embodied AI lance le sac à dos de calcul embarqué BotPack B Series

Méthode reproductible de sensibilisation à la robotique par interaction LLM : résultats d'un défi d'entreprise

CorridorVLA : contraintes spatiales explicites pour les têtes d'action génératives via des ancres éparses

Comment fonctionnent réellement les VLA en environnements ouverts

ExpressMM : des comportements de manipulation mobile expressifs dans les interactions humain-robot

Pudu Robotics lève près de 150 millions de dollars pour cibler les applications industrielles

Vidéo : SamuRoid, le robot humanoïde chinois compact aux interactions plus intelligentes

Le robot IA de Sony bat des joueurs pendant qu'un robot humanoïde remporte une course à Pékin

AGIBOT et l'Institut de promotion du commerce et des investissements de Macao concluent un partenariat stratégique pour déployer l'IA incarnée à l'échelle mondiale

Pudu Robotics lève près d'un milliard de yuans et ouvre son siège américain

AWS et NEURA Robotics unissent leurs forces pour industrialiser l’IA physique

PokeVLA : un modèle vision-langage-action compact enrichi d'une connaissance globale du monde

JoyAI-RA 0.1 : un modèle de base pour l'autonomie robotique

X Square Robot lance WALL-B, un modèle d'IA embarquée pour usage domestique

Le robot de tennis de table de Sony bat des joueurs d'élite

HII s'associe à Path Robotics et GrayMatter Robotics pour accélérer la construction navale

VLA Foundry : un cadre unifié pour l'entraînement des modèles vision-langage-action

Alfie : nouveau robot humanoïde autonome pour les tâches industrielles complexes

ROBOGATE : détection adaptative des défaillances pour un déploiement sûr des politiques de robots via un échantillonnage en deux étapes axé sur les limites

InternScenes : un jeu de données de scènes intérieures simulables à grande échelle avec des agencements réalistes

Benchmark COIN : quand le raisonnement rencontre l'interaction incarnée

XEmbodied : un modèle fondation aux indices géométriques et physiques renforcés pour les environnements incarnés à grande échelle

L'utilisation des LLM pour la planification en IA incarnée introduit des risques de sécurité systématiques

La réalité virtuelle pour faciliter la collecte de données dans les tâches d'IA incarnée

IA incarnée multi-agents : allocation de puissance centrée sur la mémoire pour la réponse aux questions

StableIDM : stabilisation du modèle de dynamique inverse face à la troncature du manipulateur par raffinement spatio-temporel

GaLa : des modèles vision-langage guidés par hypergraphe pour la planification procédurale

Démasquer l'illusion du raisonnement incarné dans les modèles vision-langage-action (VLA)

Modèle World-Value-Action : planification implicite pour les systèmes vision-langage-action (VLA)

Guidance stable par le langage pour les modèles vision-langage-action (VLA)

OmniVLA-RL : modèle vision-langage-action avec compréhension spatiale et apprentissage par renforcement en ligne

EgoWalk : un jeu de données multimodal pour la navigation robotique en conditions réelles

ReconVLA : un cadre VLA guidé par l'incertitude et la détection des défaillances pour le contrôle robotique

Alignement de sécurité des modèles VLA par apprentissage contraint : le projet SafeVLA

ST-π : VLA spatio-temporel structuré pour la manipulation robotique

AnchorRefine : manipulation synergique par ancrage de trajectoire et raffinement résiduel pour les modèles VLA

ShadowAI lève 14 millions de dollars pour ses modèles du monde en 3D

IA embarquée : optimiser la mémoire pour faire tourner de grands modèles sur NVIDIA Jetson

La startup d'IA incarnée X Square Robot lève près de 276 millions de dollars en série B, menée par Xiaomi et Sequoia China

GIST : extraction de connaissances multimodales et ancrage spatial par topologie sémantique intelligente

Modèles fondation en robotique : revue complète des méthodes, modèles, jeux de données, défis et perspectives

Hesai dévoile sa stratégie et de nouveaux produits pour redéfinir l'infrastructure d'IA physique, de l'automobile à la robotique