Dossier Unitree — page 3

434 articles · page 3 sur 9

Unitree, l'humanoïde et quadrupède chinois low-cost : G1, H1, R1, prix grand public sur AliExpress, démonstrations agressives en vidéo et impact sur les concurrents premium.

101arXiv cs.RO RecherchePaper

MAPL : apprentissage des préférences multi-objectifs pour la locomotion robotique

Des chercheurs présentent MAPL (Multi-Objective AI-Informed Preference Learning), un cadre d'apprentissage par renforcement pour la locomotion quadrupède qui remplace les fonctions de récompense manuelles par des préférences générées par LLM. Publié sur arXiv (réf. 2606.25398) en juin 2025, le système soumet des paires de trajectoires à un grand modèle de langage, qui les évalue selon plusieurs critères sémantiques distincts, formulés en langage naturel générique et invariants selon le terrain. Ces préférences par objectif alimentent un modèle de scoring à plusieurs têtes, dont les sorties sont agrégées en récompense scalaire pour l'optimisation de politique. Sur quatre environnements de simulation quadrupède, les auteurs rapportent des performances comparables ou supérieures à des récompenses conçues par des experts du domaine. L'intérêt de MAPL tient à sa décomposition structurée des objectifs, là où les méthodes LLM existantes se limitent à un jugement global entre comportements. En robotique industrielle, la conception de fonctions de récompense reste un goulot d'étranglement reconnu, exigeant de longues itérations entre ingénieurs RL et spécialistes métier. Substituer ce travail par des descriptions en langage naturel, réutilisables sans réécriture d'équations, réduirait le coût d'adaptation à de nouvelles tâches. La décomposition en critères distincts offre aussi une meilleure interprétabilité : il devient possible d'identifier quels objectifs sont en tension, ce qui facilite le débogage comportemental. MAPL s'inscrit dans la vague d'automatisation de la conception de récompenses via LLM, initiée notamment par EUREKA (NVIDIA, 2023), qui générait directement du code de récompense via GPT-4, et par RL-VLM-F, qui exploite des modèles vision-langage pour évaluer les comportements. La locomotion quadrupède est un benchmark standard utilisé par des projets comme ANYmal (ETH Zurich) et les plateformes Unitree. Plusieurs limites méritent d'être signalées : l'article reste un preprint non relu par les pairs, les expériences sont menées uniquement en simulation sans validation physique, et le LLM utilisé pour générer les préférences n'est pas spécifié, ce qui complique la reproductibilité. Les extensions naturelles concernent la validation sur robot réel et l'application à des morphologies plus complexes, comme les humanoïdes, où l'ingénierie de récompense est particulièrement coûteuse.

Dossier Unitree — page 3

MAPL : apprentissage des préférences multi-objectifs pour la locomotion robotique

PDS Joint : une articulation à double spirale paramétrique pour mains dextériques

SlipSense : détection du glissement en temps réel pour robots à pattes par capteurs multimodaux

Kunlun Xing, startup d'IA incarnée, lève plusieurs milliards de yuans et devient licorne en 90 jours

Vidéo : une entreprise chinoise montre un modèle unique pilotant à la fois un humanoïde et un bras robotique

Données et standards pour la robotique humanoïde : l'infrastructure manquante de l'IA physique

Soutien politique et production de masse propulsent les ETF de robots humanoïdes à l'aube d'une phase critique

ZiMPedance : modélisation et contrôle ZMP intégrant l'impédance pour robots quadrupèdes transportant des charges

DREAM-Chunk : regroupement d'actions réactif avec modèle du monde latent

Le prochain robot humanoïde pourrait ne pas ressembler à un humain

DexLink Hand : une main compacte et abordable à 16 degrés de liberté dotée d'une dextérité humaine

OmniRetarget : génération de données préservant les interactions pour la loco-manipulation corps entier des humanoïdes

Alibaba dévoile Qwen-Robot : trois modèles fondation pour l'IA incarnée

Suivi binaire pour la QA spatiale et la navigation avec des modèles vision-langage ouverts

LoComposition : locomotion quadrupède économe en énergie et adaptée au terrain, sans a priori de démarche

THEKER lève 85 millions de dollars : l’Europe produit enfin ses candidats à la robotique généraliste

Vidéo : des robots humanoïdes volent la vedette dans America's Got Talent

IA incarnée sûre pour les tâches à long horizon : une analyse multi-couches de la manipulation robotique

M3imic : apprentissage d'un contrôleur corps entier polyvalent pour l'imitation multimodale de mouvements

Transfert de style de mouvement humain pour le contrôle physique de robots humanoïdes

LEGS : affinage de VLA sans téléopération pour la loco-manipulation humanoïde dans un monde Gaussian Splatting incarné

Suivi corporel intégral contraint pour robots humanoïdes

Apprentissage du contrôle corps entier adapté au terrain pour la loco-manipulation perceptive de robots à pattes

ORBBEC s'étend au-delà de la vision robotique vers l'IA physique et l'impression 3D

La Chine déploie des robots humanoïdes capables de trier 1 200 colis par heure dans un grand centre postal

MonoDuo : apprendre des politiques bimanuelles avec un seul bras robotique

BYD confirme son offensive robotique humanoïde avec le projet de septième génération Yao-Shun-Yu, ciblant particulièrement les concessionnaires et les foyers

SOLE-R1 : le raisonnement vidéo-langage comme unique récompense pour l'apprentissage par renforcement sur robot

Étude de l'effet d'un retrofit à actionnement élastique en série sur des actionneurs boîte noire

La Chine donne une carte d’identité aux robots humanoïdes : Bientôt le droit de vote ?

OCELOT : odométrie et estimation du contact pour robots à pattes

Apprendre à évoluer : champs interactifs multimodaux pour la navigation humanoïde robuste en environnements dynamiques

WestWorld : un modèle du monde de trajectoires évolutif intégrant des connaissances pour systèmes robotiques variés

Tests adversariaux des filtres de sécurité du robot humanoïde SPARK

PRIME : estimation inertielle et de mouvement physiquement cohérente pour robots à pattes et humanoïdes

frax : cinématique et dynamique robotique rapide en JAX

Asimov : un robot humanoïde open source accessible à tous

DeepMotor : une startup de Pékin mise sur les données en première personne pour une IA incarnée générale

Derrière le marathon robotique d'Honor : 7 fournisseurs chinois au service du robot Lightning

Muninn : un modèle de diffusion de trajectoires, désormais plus rapide

VEGA : alignement par ancrage de l'encodeur visuel pour les modèles VLA à conscience spatiale

IA incarnée : conditionnement géométrique explicite des escaliers pour une locomotion humanoïde robuste

Figure et 1X accélèrent la production de robots humanoïdes

Tien Kung 3.0 remporte le Robot Warrior Challenge en Chine sans intervention humaine

Un pipeline de déploiement rapide pour la préhension autonome de robots humanoïdes basé sur des modèles fondation

Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain

Modèles fondation en robotique : revue complète des méthodes, modèles, jeux de données, défis et perspectives

CLAW : génération de mouvements corps entier composables et annotés en langage naturel

L'usine Tesla de Shanghai capable de produire des robots humanoïdes, selon son président en Chine

Agibot livre son 10 000e robot humanoïde produit en série