
Exploiter l'agilité des robots hybrides roues-pattes pour l'évitement réflexe d'obstacles à haute dynamique
Des chercheurs ont présenté AWARE (Adaptive Wheeled-Legged Avoidance and Reflexive Evasion), un nouveau système d'apprentissage par renforcement hiérarchique conçu pour permettre aux robots hybrides roues-pattes d'esquiver des obstacles en mouvement rapide de manière réflexive. La recherche, publiée sur arXiv sous la référence 2604.23761, s'appuie sur des expériences menées dans le simulateur Isaac Lab d'NVIDIA ainsi que sur des déploiements en conditions réelles sur la plateforme robotique M20. Le système génère spontanément des comportements d'évitement variés, notamment une esquive frontale en plongeon et un écart latéral, sans que ces mouvements aient été explicitement programmés.
L'intérêt de cette avancée réside dans la capacité à résoudre un problème longtemps considéré comme un verrou technique majeur : les robots à morphologie hybride souffrent d'un couplage entre leurs modes de locomotion et de contraintes non holonomes qui rendent l'évitement dynamique particulièrement difficile à contrôler. En exploitant pleinement la dualité roues-pattes, AWARE permet à ces plateformes d'atteindre un niveau d'agilité réflexive inédit, ouvrant la voie à des déploiements dans des environnements industriels dangereux, des opérations de sauvetage ou encore des scénarios militaires où la rapidité de réaction face à des menaces mobiles est critique.
Les robots à pattes ont longtemps dominé la robotique d'exploration en terrain accidenté, mais leur consommation énergétique élevée limite leur autonomie. Les plateformes hybrides roues-pattes, comme le M20 utilisé dans ces travaux, cherchent à combiner le meilleur des deux mondes depuis plusieurs années, avec des équipes comme Boston Dynamics ou des laboratoires universitaires qui explorent ce compromis. L'approche par apprentissage par renforcement hiérarchique adoptée ici représente une tendance forte dans le domaine : plutôt que de coder manuellement chaque comportement, on laisse émerger des stratégies complexes depuis l'entraînement. La prochaine étape logique sera d'étendre ces capacités à des environnements peuplés de multiples obstacles dynamiques simultanés.



