Dossier Figure — page 4

624 articles · page 4 sur 13

Figure, le constructeur de robots humanoïdes le plus capitalisé : Figure 02 et 03, modèle Helix VLA, déploiements BMW, partenariats avec OpenAI puis indépendance.

151arXiv cs.RO RechercheOpinion

MANGO : génération automatisée d'oracles de test multi-agents pour les modèles vision-langage-action

Des chercheurs ont publié fin juin 2026 sur arXiv (2606.24815) un framework nommé MANGO, pour Multi-Agent test oracle GENeration for Vision-Language-Action models. Les modèles VLA constituent la nouvelle génération de systèmes de contrôle robotique : ils intègrent dans une architecture unifiée la perception visuelle, la compréhension du langage naturel et la génération d'actions motrices. L'approche dominante pour les tester repose sur des oracles symboliques écrits manuellement, des fonctions qui évaluent si un robot a accompli sa tâche à partir de l'état final de l'environnement. MANGO automatise cette étape via un pipeline de trois agents LLM collaboratifs : un Generator qui produit une bibliothèque d'actions atomiques réutilisables, un Assessor qui ancre ces définitions dans le simulateur, et un Judge qui arbitre et affine les artefacts par feedback itératif. Le système a été évalué sur les benchmarks LIBERO_10 et RoboCasa Humanoid Tabletop. L'intérêt principal est de supprimer le goulot d'étranglement humain dans la qualification des robots VLA. Les oracles symboliques actuels exigent une expertise domaine significative et restent couplés à une tâche précise, ce qui limite fortement leur réutilisation dès qu'on change de scénario ou de cellule de travail. MANGO génère des oracles à grain fin capables d'évaluer des étapes intermédiaires, pas seulement l'état final, ce qui améliore la localisation des pannes : au lieu de constater qu'un robot a échoué, on identifie quelle action atomique a dévié. Les résultats montrent une détection de défauts comparable aux oracles symboliques manuels avec une couverture diagnostique plus riche, un levier direct pour les équipes QA qui valident des flottes de robots VLA en production. Les modèles VLA ont connu une accélération marquée depuis 2024 avec Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA, Helix de Figure AI et plusieurs variantes issues des laboratoires académiques. Tous partagent le même point faible : leur validation reste artisanale, peu reproductible, et difficile à passer à l'échelle. MANGO s'inscrit dans un effort croissant pour combler le fossé entre démos en laboratoire et déploiement industriel, en dotant les pipelines CI/CD robotiques d'outils d'évaluation automatisés. L'article demeure un preprint non relu par les pairs et le code n'est pas encore publié, ce qui invite à nuancer les résultats avant toute adoption. La prochaine étape naturelle serait une validation sur environnements physiques réels, au-delà des scénarios de manipulation sur table couverts par les benchmarks actuels.

Dossier Figure — page 4

MANGO : génération automatisée d'oracles de test multi-agents pour les modèles vision-langage-action

Des robots humanoïdes chinois relèvent le défi du penalty alors que Messi et Ronaldo illuminent la Coupe du Monde FIFA

Apprentissage de la navigation au dernier mètre par catégorie à partir de démonstrations RGB d'une instance unique

Le robot Codey, adapté aux enfants, illustre l'avenir de l'AGI incarnée dans l'éducation et la santé

Une société américaine dévoile des humanoïdes et robots avec un nouvel écosystème pour l'intelligence incarnée

WeaveLA : mémoire latente inter-sous-tâches pilotée par événements pour la manipulation robotique répétitive

OmniVTLA : modèles vision-tactile-langage-action avec perception tactile à alignement sémantique

Piloter l'apprentissage par renforcement génératif vers un contrôleur robotique stable

X-Loco : vers un contrôle généraliste de la locomotion humanoïde par distillation synergique de politiques

Capteurs tactiles dynamiques et évolutifs grâce à des guides d'ondes acoustiques passifs et flexibles

IA incarnée : la correspondance proprioceptive-visuelle permet aux robots humanoïdes de se distinguer d'autrui

Du numérique au physique : des agents numériques comme coachs autonomes de l'intelligence physique

Les robots humanoïdes chinois font sensation sur Internet comme influenceurs à l'étranger

Dream-Tac : un modèle d'action monde tactile unifié pour la manipulation robotique riche en contacts

X-OP : téléopération corps entier entre morphologies différentes via MPC

Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés

Apprentissage de politiques par simulation pour la loco-manipulation des robots humanoïdes

Un robot humanoïde gravit un volcan de 6 200 m, l'équipe vise ensuite l'Everest

Video Friday : ce robot court dans les escaliers sans tomber

M3imic : apprentissage d'un contrôleur corps entier polyvalent pour l'imitation multimodale de mouvements

VISTA : adaptation des données UMI fondée sur la vision et validée par la physique pour l'entraînement de modèles VLA

Un fabricant shanghaïen dévoile un robot humanoïde de 1,2 m à double cerveau et design compact

Saisie puis planification avec attribution d'échecs : un cadre fermé en deux étapes pour la manipulation robotique précise et généralisable

Locomotion naturelle : principe et méthode

Les modèles VLA peuvent-ils apprendre en continu depuis des données réelles sans oublier ?

IntBot et Certis Group s'associent pour déployer l'IA physique en entreprise à Singapour

SpecPrune-VLA : accélérer les modèles vision-langage-action via un élagage auto-spéculatif sensible aux actions

Apprentissage de séquences d'actions continues haute fréquence dans l'espace latent

La Chine attribue un identifiant numérique à chaque robot humanoïde pour renforcer les standards industriels

Des ingénieurs américains franchissent une étape clé vers une conscience précise de l'environnement réel pour les robots autonomes

Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA

Comprendre les défaillances multimodales dans le clonage comportemental par découpage d'actions

Une entreprise chinoise accélère l'intelligence des robots humanoïdes avec un contrôle à 300 FPS

La robotique connaîtra-t-elle son moment ChatGPT ?

DEFLECT : exécution robuste aux délais par ajustement contrefactuel estimé par flow-matching pour les politiques VLA

Xynova dévoile une main dextérique hybride de deuxième génération pour robots humanoïdes

PRIME : estimation inertielle et de mouvement physiquement cohérente pour robots à pattes et humanoïdes

Autonomie robotique à seuil de confiance : quand l'incertitude est-elle vraiment utile ?

Amélioration des capacités des robots manipulateurs collaboratifs par algorithme de tâches

Qu'est-ce qui rend un métier ennuyeux, sale ou dangereux ?

OneRobotics déploie des robots domestiques dans des scénarios réels à l'échelle mondiale : le rival chinois de Figure AI

Comment l'IA à base d'agents permet la navigation robotique généraliste

Any3D-VLA : améliorer la robustesse des modèles VLA grâce à des nuages de points diversifiés

Quels sont les facteurs limitants de la navigation vision-langage ?

CUBic : cadre unifié et coordonné de perception et contrôle bimanuels

RIO : un système d'entrées/sorties robotiques flexible et en temps réel pour l'apprentissage multi-plateforme

Pro Universe Robotics dévoile sa gamme de produits d'IA incarnée industrielle 2.0

Théorie non asymptotique de la dynamique d'erreur dépendante du gain en clonage comportemental

SABER : jeu de données incarné, évolutif et axé sur les actions pour l'adaptation VLA au monde réel

VEGA : alignement par ancrage de l'encodeur visuel pour les modèles VLA à conscience spatiale