Dossier IA physique & VLA — page 4

633 articles · page 4 sur 13

L'IA physique : modèles vision-langage-action qui contrôlent des corps robotisés. État de l'art académique (CoRL, RSS) et premières productions industrielles.

151Interesting Engineering HumanoïdesOpinion

Une société américaine dévoile des humanoïdes et robots avec un nouvel écosystème pour l'intelligence incarnée

Faraday Future (FF), entreprise californienne principalement connue comme constructeur de véhicules électriques en difficulté, a présenté le 18 juin 2026 à son nouveau siège d'El Segundo (Californie) une gamme robotique baptisée "EAI Robot World", articulée autour de six séries de produits. La pièce maîtresse est le robot humanoïde Futurist, redessiné : 54 kg (14 % plus léger que son prédécesseur), 31 degrés de liberté (DOF), un couple au niveau du genou de 320 Nm et une vitesse de pointe annoncée à 17,7 km/h, alimenté par un double pack batterie promettant 6 heures d'autonomie. L'architecture logicielle repose sur un modèle Vision-Language-Action (VLA) couplé à un "World Model" pour la perception et la prise de décision autonome. Aucun tarif ni client n'ont été dévoilés pour le Futurist : FF a renvoyé au salon Automate 2026 à Chicago, le 22 juin. En revanche, le quadrupède FX Navi, 8 kg, 12 articulations motorisées, utilisant un smartphone (iOS ou Android) glissé dans un module tête comme unité de calcul, est disponible immédiatement à 1 990 dollars, ciblant la salle de classe et l'usage domestique. Deux formats supplémentaires ont été esquissés : Master Mini (~1 m, compétitions de robotique éducative) et Nova (~50 cm, robot compagnon enfant), sans date ni prix communiqués. La stratégie "one brain, multiple forms" de FF, qui consiste à partager une même couche d'intelligence VLA+World Model sur plusieurs facteurs de forme, est cohérente avec ce que font NVIDIA (GR00T N2) ou Physical Intelligence (pi-0) côté logiciel, et mérite d'être distinguée des approches produit unique. Toutefois, la prudence s'impose : les performances du Futurist (320 Nm, 17,7 km/h) sont comparables aux annonces récentes d'Unitree ou Figure AI, mais sans démonstration publique indépendante ni données de cycle réel, elles restent des chiffres de fiche technique. L'usage d'un smartphone comme cerveau du FX Navi réduit les coûts mais impose des contraintes de puissance de calcul qui limiteront les cas d'usage autonomes avancés. À ce stade, le Futurist est une annonce de produit, pas un déploiement ; le FX Navi, lui, est un produit livrable. Faraday Future porte un passif lourd : introduction en bourse via SPAC en 2021, multiples alertes de continuité d'exploitation, enquête de la SEC, et départ de son fondateur Jia Yueting dans le chaos. Ce pivot vers la robotique s'inscrit dans un mouvement plus large d'entreprises tech/EV cherchant un second souffle dans l'IA incarnée. Sur le segment humanoïde commercial, FF affronte Figure AI (Figure 03, déployé chez BMW), Tesla (Optimus Gen 3, production interne), Agility Robotics (Digit, partenariat Amazon), et en Europe Wandercraft ou Enchanted Tools, acteurs qui cumulent davantage de déploiements terrain. La prochaine échéance concrète est Automate 2026 le 22 juin, où FF devra fournir prix, volumes et clients réels pour le Futurist, faute de quoi l'annonce restera dans la catégorie teaser.

Dossier IA physique & VLA — page 4

Une société américaine dévoile des humanoïdes et robots avec un nouvel écosystème pour l'intelligence incarnée

SC3-Eval : évaluer les modèles fondation pour la robotique via la génération vidéo auto-cohérente

Autonomique déploie des robots semi-humanoïdes et de l'IA chez un équipementier automobile canadien de rang 1

Advanced Humanoid Forum 2027 en Allemagne

ACE-Ego-0 : unification des données égocentrées humaines et robotiques pour le préentraînement VLA

OmniVTLA : modèles vision-tactile-langage-action avec perception tactile à alignement sémantique

LaST₀ : raisonnement spatio-temporel latent en chaîne pour les modèles VLA robotiques

Penser moins, agir tôt : raisonnement latent renforcé avec sortie anticipée dans les modèles VLA

Modélisation unifiée mouvement-action pour l'apprentissage sur robots hétérogènes

Politique de diffusion spatialement conditionnée : manipulation précise et robuste avec une seule caméra RGB

GAE : libérer le potentiel physique des VLM grâce à un expert d'action généralisable

ActionMap : apprentissage de politiques robotiques par carte de chaleur voxel

Prédiction d'horizon d'exécution dynamique pour les politiques robotiques par segments

TacCoRL : intégration du retour tactile dans les modèles VLA par simulation

L'équipe Tsinghua-Harvard développe Acorn, un robot « zéro-données » qui apprend par instinct, sans entraînement

Modèles de tiges pour le contrôle des robots continus et souples : une revue

SARM2 : modélisation de récompense multi-tâches par étape pour la manipulation robotique auto-améliorante

Apprentissage de politiques par simulation pour la loco-manipulation des robots humanoïdes

Symskill : co-invention de symboles et de compétences pour une manipulation réactive à long horizon, économe en données

VoLo : un orchestrateur physique pour la manipulation à vocabulaire ouvert et horizon temporel long

HERO : saisie visuelle d'objets à vocabulaire ouvert par contrôle corps entier d'un humanoïde

Les budgets de preuves visuelles pour des VLA plus généralisables : voir moins, spécifier davantage

IA incarnée et chaîne de pensée : vers une manipulation robotique généralisable

GeoAlign : au-delà de la sémantique avec l'alignement spatial guidé par l'état dans les modèles VLA

Les modèles VLA aériens peuvent-ils coopérer ? Évaluation de la coordination air-sol en boucle fermée avec CARLA-Air

Bibliothèque d'experts à mélange dynamique progressif pour l'apprentissage robotique continu

XPeng présente sa gamme complète d'IA physique au salon automobile GBA 2026

Tabero : manipulation douce par retour de force en boucle fermée (vision, toucher, langage)

ProgVLA : apprentissage de compétences de manipulation robotique guidé par la progression

IntBot et Certis Group s'associent pour déployer l'IA physique en entreprise à Singapour

InvariantCloud : un framework de nuage de points globalement invariant et indexé de manière unique pour le suivi robuste de pose tactile à 6 DOF

Quelles questions les robots devraient-ils pouvoir répondre ? Un jeu de données pour la robotique explicable

LimX Intelligence lance LimX Luna : un robot humanoïde pleine taille à 298 000 RMB

SONIC : un système de suivi du mouvement étendu pour le contrôle corporel intégral des humanoïdes

Apprentissage d'une manipulation dextérique robuste en main à partir de capteurs articulaires avec un transformeur proprioceptif

SEDualVLN : un système dual à représentation spatiale enrichie pour la navigation vision-langage

OpenFrontier : navigation générale guidée par des frontières vision-langage

XR-1 : vers des modèles VLA polyvalents par apprentissage de représentations vision-mouvement unifiées

HCSG : raisonnement sémantique-géométrique centré sur l'humain pour la navigation vision-langage

Moore Threads et Guangyun Intelligence s'associent pour bâtir une base d'IA physique souveraine avec calcul national et simulation

Modèle JODA : dynamique articulaire composable pour objets articulés

SeedPolicy : passage à l'échelle par politique de diffusion auto-évolutive pour la manipulation robotique

VLA-GSE : améliorer l'ajustement fin efficace en paramètres des VLA avec des experts généralisés et spécialisés

OA-WAM : un modèle du monde à adressage par objet pour la manipulation robotique robuste

RLDX-1 : rapport technique

Modèle MVP-LAM : apprentissage de représentations d'actions latentes centrées sur l'action par reconstruction multi-points de vue

Modèles du monde nativement physiques : perspective hamiltonienne pour la modélisation générative

IA incarnée et interprétabilité causale : comprendre pour mieux généraliser dans les modèles VLA

LaST-R1 : renforcement de l'action par raisonnement latent physique adaptatif pour les modèles VLA

PRTS : un système de raisonnement et de planification primitifs via des représentations contrastives