Dossier Agility Robotics — Digit — page 3

340 articles · page 3 sur 7

Agility Robotics et Digit : déploiement entrepôts (Amazon, GXO, Spanx), focus pick-and-place, levée de fonds et batailles juridiques.

101arXiv cs.RO RechercheOpinion

WOLF-VLA : framework de locomotion optimale corps entier pour humanoïdes avec apprentissage vision-langage-action

Des chercheurs ont publié le 25 juin 2026 sur arXiv (arXiv:2606.25591) WOLF-VLA, un cadre unifié qui combine la synthèse de trajectoires par contrôle optimal (OC) en corps entier avec un dataset multimodal à grande échelle, dans le but d'entraîner des modèles VLA (Vision-Language-Action) capables de piloter la locomotion d'humanoïdes directement depuis des instructions en langage naturel. Le dataset couvre six familles de tâches de locomotion, paramétrées par des variations d'environnement, de couleurs d'objets, de placements et de distracteurs visuels. L'entrainement utilise des trajectoires articulaires dynamiquement cohérentes, des observations visuelles ego-centriques et des instructions textuelles. Les résultats annoncés font état d'une robustesse notable aux variations de conditions initiales et de performances compétitives sur plusieurs tâches et configurations d'environnement. Le dataset complet, les checkpoints de modèle et la suite de benchmarks en simulation seront publiés en open source. Ce travail comble un angle mort important : si les VLA ont prouvé leur efficacité en manipulation (voir Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA), leur extension à la locomotion en corps entier, contact-riche et dynamiquement contrainte, restait quasi inexploitée. Les trois verrous identifiés par les auteurs sont précis -- pénurie de données, absence de démonstrations dynamiquement consistantes, et difficulté à encoder optimalité et sécurité dans un pipeline d'apprentissage -- ce sont exactement les obstacles qui ont maintenu la locomotion hors du champ VLA. La génération de trajectoires via contrôle optimal comme source de données supervisées est une approche méthodologiquement solide pour contourner la dépendance aux démonstrations humaines ou téléopérées. Ce papier s'inscrit dans un mouvement plus large vers des politiques de locomotion instruction-guidées, concurrent de travaux comme ANYmal (ETH Zurich / ANYbotics), Digit (Agility Robotics) ou les approches reinforcement learning de Boston Dynamics. La release open source du benchmark constitue la contribution potentiellement la plus durable : établir un référentiel reproductible pour la locomotion humanoïde VLA permettrait de structurer les comparaisons dans un domaine où les métriques sont encore disparates. Aucun déploiement physique n'est mentionné dans cet article, qui reste une contribution de recherche en simulation -- le transfert sim-to-real sur des plateformes comme Unitree H1 ou Figure 03 constitue la prochaine étape non résolue.

UELe benchmark open source pourrait servir de référence aux laboratoires européens travaillant sur la locomotion humanoïde (ETH Zurich/ANYbotics notamment), mais aucun acteur français ni institution de l'UE n'est directement impliqué dans cette publication.

Dossier Agility Robotics — Digit — page 3

WOLF-VLA : framework de locomotion optimale corps entier pour humanoïdes avec apprentissage vision-langage-action

Kunlun Xing, startup d'IA incarnée, lève plusieurs milliards de yuans et devient licorne en 90 jours

Bear Robotics acquiert Kinisi Robotics pour renforcer ses capacités d'IA physique

Le robot humanoïde gravit un sommet de 6 000 mètres pour la première fois, cap ensuite sur l'Everest

Soutien politique et production de masse propulsent les ETF de robots humanoïdes à l'aube d'une phase critique

Le secret des robots humanoïdes victorieux en marathon

Le prochain robot humanoïde pourrait ne pas ressembler à un humain

Quel point de départ pour générer des actions ? Un prior source apprenable pour les politiques robotiques génératives

OmniRetarget : génération de données préservant les interactions pour la loco-manipulation corps entier des humanoïdes

λ-Atteignabilité : équations de Bellman de sécurité à horizon géométrique pour les humanoïdes

HATS : système de téléopération humain-agent pour la collecte de données multi-bras

VENOM : réseau polyvalent de suivi de mouvement pour toutes morphologies corporelles

Piloter l'apprentissage par renforcement génératif vers un contrôleur robotique stable

Soutenu par Samsung, un robot à 7 DOF apprend à travailler dans un grand entrepôt e-commerce

Capteurs tactiles dynamiques et évolutifs grâce à des guides d'ondes acoustiques passifs et flexibles

Un robot humanoïde coréen exécute une danse K-POP virale apprise en regardant des vidéos

Des avancées au Congrès pour créer une Commission nationale sur la robotique

X-OP : téléopération corps entier entre morphologies différentes via MPC

Dream-Tac : un modèle d'action monde tactile unifié pour la manipulation robotique riche en contacts

Récupération après chute sur terrains variés par apprentissage à phases et terrains découplés

Vidéo : des robots humanoïdes volent la vedette dans America's Got Talent

RealDexUMI : interface portable universelle pour l'apprentissage de la manipulation dextérique

Suivi corporel intégral contraint pour robots humanoïdes

Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes

La Chine va attribuer des identifiants numériques aux robots humanoïdes pour suivre leur cycle de vie

Vers une intelligence incarnée partagée pour les robots humanoïdes : développement et tests du robot ergoCub

Optimisation par données des configurations de capteurs tactiles pour la manipulation dextérique

Apprentissage de séquences d'actions continues haute fréquence dans l'espace latent

Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état

Comprendre les défaillances multimodales dans le clonage comportemental par découpage d'actions

IA à l'échelle urbaine : du pilote à la généralisation, robots en conditions réelles et passage à l'échelle

Une entreprise chinoise accélère l'intelligence des robots humanoïdes avec un contrôle à 300 FPS

La robotique connaîtra-t-elle son moment ChatGPT ?

LLMs incarnés : quand une meilleure fidélité d'observation nuit à la résolution de problèmes

CEER : contrôle unifié de l'effecteur final souple et de la base pour la loco-manipulation hiérarchique des humanoïdes

PRIME : estimation inertielle et de mouvement physiquement cohérente pour robots à pattes et humanoïdes

Boston Dynamics révèle comment Atlas soulève des charges industrielles de 45 kg en production

Qu'est-ce qui rend un métier ennuyeux, sale ou dangereux ?

Fanuc renforce son partenariat avec Nvidia pour la simulation de robots IA et les jumeaux numériques

Asimov : un robot humanoïde open source accessible à tous

Comment l'IA à base d'agents permet la navigation robotique généraliste

Vers l'intelligence des mains dextériques en robotique : un état de l'art

IA incarnée : conditionnement géométrique explicite des escaliers pour une locomotion humanoïde robuste

Apprendre à sentir le futur : DreamTacVLA pour la manipulation riche en contacts

Un nouveau système d'IA aide les robots à transférer leur entraînement virtuel vers des tâches réelles

Un algorithme certifié exact pour la calibration généralisée robot-monde et main-œil

Un cadre d'autonomie sémantique pour robots mobiles d'intérieur intégrant un VLM : raisonnement déterministe hybride et mémoire adaptative inter-robots

Figure et 1X accélèrent la production de robots humanoïdes

On n’est plus dans la science-fiction : il est vraiment possible d’acheter un robot humanoïde en promo aujourd’hui

Digit apprend à danser en une nuit grâce à la simulation