
DynaWM : distillation consciente de la dynamique avec modèle du monde pour une locomotion fluide sur escaliers continus
Une équipe de chercheurs publie en juin 2026 sur arXiv (2606.24089) un cadre d'apprentissage baptisé DynaWM, destiné aux robots bipèdes à roues pour traverser des escaliers continus avec fluidité. Ces plateformes hybrides franchissent déjà pentes et marches isolées, mais la montée de longs escaliers reste hors de portée des architectures actuelles. DynaWM apporte deux innovations dans le paradigme de distillation enseignant-étudiant : un modèle du monde utilisé comme régulariseur pour forcer l'encodeur à représenter les dynamiques forward du terrain, et un encodeur cible à momentum qui stabilise le transfert de connaissances. Cette seconde brique s'attaque directement à l'effondrement dimensionnel (dimensional collapse), un problème récurrent quand les mises à jour du modèle enseignant sont non-stationnaires. Validé en simulation et sur matériel réel, DynaWM démontre une meilleure adaptabilité au terrain et une locomotion plus fluide que les approches de référence, selon des métriques quantitatives et des visualisations par analyse en composantes principales (ACP).
L'enjeu dépasse la performance académique : les escaliers constituent l'un des derniers verrous pour déployer des robots mobiles dans des bâtiments multi-étages sans infrastructure dédiée. Pour un intégrateur ou un décideur industriel, cette capacité est un critère de déploiement critique. La contribution de DynaWM tient à sa méthode de distillation : là où les frameworks classiques dégradent progressivement la représentation des dynamiques terrain lors du transfert de politique, le régulariseur world model maintient une conscience géométrique complète. La validation sur hardware réel est notable, car le sim-to-real gap reste un angle mort fréquent dans les publications sur la locomotion bipède.
Les robots à roues et jambes hybrides constituent un segment en pleine expansion, porté par des plateformes comme celles d'Unitree ou les systèmes de recherche développés à l'ETH Zurich, CMU et Berkeley. La distillation enseignant-étudiant est devenue le paradigme dominant pour apprendre des politiques de locomotion robustes depuis des observations proprioceptives, en compressant des connaissances initialement acquises avec un accès complet à la géométrie du terrain. DynaWM s'inscrit dans cette lignée tout en ciblant ses failles connues. L'article ne fait état d'aucun partenariat industriel : il s'agit d'un preprint de recherche, dont les suites naturelles incluent l'intégration dans des pipelines d'entraînement pour robots de service ou d'inspection en environnements multi-étages.
Dans nos dossiers




