
StairMaster : apprendre à franchir des escaliers ajourés périlleux pour robots quadrupèdes agiles
Des chercheurs ont publié sur arXiv (2606.25765) un système baptisé StairMaster, un cadre d'apprentissage par renforcement en trois étapes permettant à un robot quadrupède Unitree Go2 de gravir des escaliers creux avec une inclinaison jusqu'à 55 degrés en transfert zéro-shot depuis la simulation. L'architecture combine un mécanisme d'attention croisée (Cross-Attention) pour extraire des structures depuis des données de profondeur bruitées, une unité récurrente spatiale (SRU) maintenant une mémoire spatio-temporelle pour compenser les zones aveugles de perception, et un pipeline de modélisation haute-fidélité du capteur de profondeur en simulation répliquant les artefacts réels. Des récompenses de perception active guidées par waypoints 3D et des pénalités cinématiques sur les barreaux creux et les arêtes de marches assurent un placement précis des appuis.
Ce résultat s'attaque à l'un des problèmes les plus difficiles de la locomotion quadrupède en milieu industriel : les escaliers à barreaux creux exposent les pattes au risque de coincement, génèrent une densité de points de profondeur très faible et un bruit haute fréquence difficile à filtrer. Que le système tienne à 55 degrés sans ré-entraînement sur le robot réel valide deux hypothèses que le secteur testait depuis plusieurs années : la modélisation fidèle des artefacts capteurs peut combler le sim-to-real gap sur la perception de profondeur, et des politiques RL peuvent généraliser à des terrains extrêmes en zéro-shot. Pour les intégrateurs déployant des robots sur des infrastructures multi-niveaux, passerelles métalliques ou escaliers de secours, ce type de politique ouvre des scénarios jusqu'ici inaccessibles.
Le Unitree Go2 est devenu un banc d'essai académique de référence pour la locomotion RL, aux côtés de l'ANYmal d'ANYbotics et du Spot de Boston Dynamics. Des équipes d'ETH Zurich (RSL), CMU et UC Berkeley ont publié des politiques sur terrains difficiles, mais aucune ne revendiquait jusqu'ici le franchissement d'escaliers creux à cette inclinaison en zéro-shot. Les auteurs ne citent aucun partenariat industriel ni timeline de déploiement commercial : il s'agit à ce stade d'un résultat de laboratoire avec démonstration vidéo, dont la robustesse en conditions réelles à plus grande échelle reste à valider.
Dans nos dossiers




