Benchmark exclusivement proprioceptif pour l'estimation…

Apprentissage par renforcement avec mélange d'experts pour la locomotion quadrupède tolérante aux pannes

53

1arXiv cs.RO

Apprentissage par renforcement avec mélange d'experts pour la locomotion quadrupède tolérante aux pannes

Des chercheurs du Dynamic Legged Systems Lab de l'Istituto Italiano di Tecnologia (IIT) proposent sur arXiv (prépublication 2506.25965) une architecture de contrôle modulaire pour robots à pattes conçue pour maintenir la locomotion en cas de panne d'actionneur. Le système repose sur un mélange d'experts (Mixture-of-Experts, MoE) piloté par apprentissage par renforcement : un module de diagnostic identifie en temps réel le type de défaillance (joint bloqué, couple réduit, actionneur hors service), puis active l'expert spécialisé correspondant parmi plusieurs politiques de contrôle distinctes, chacune entraînée pour un mode de panne spécifique. Les expériences menées dans le simulateur IsaacLab montrent que ces politiques modulaires surpassent systématiquement des politiques monolithiques de taille comparable sur l'ensemble des scénarios de panne évalués. L'architecture conserve de surcroît des performances compétitives avec une capacité réseau significativement réduite, un critère déterminant pour les plateformes embarquées à ressources de calcul limitées, notamment en contexte d'exploration planétaire. Ce résultat adresse un angle mort persistant du déploiement hors-laboratoire des robots à pattes : la robustesse aux défaillances matérielles en cours de mission. Les politiques monolithiques entraînées par RL, qui ont produit des performances remarquables sur terrain accidenté (ANYmal d'ETH Zurich, Spot de Boston Dynamics, MIT Cheetah), supposent implicitement l'intégrité de l'ensemble des actionneurs. Injecter explicitement l'état diagnostiqué de panne dans la boucle de décision permet à chaque expert de se spécialiser sur un sous-espace comportemental bien délimité, ce qui explique leur supériorité même à capacité réduite. Pour un intégrateur ou un concepteur de mission, l'architecture MoE trace une voie concrète vers des robots capables de poursuivre une mission malgré une défaillance partielle, sans intervention humaine ni recalibration à distance. L'IIT est l'un des laboratoires européens de référence en robotique à pattes, à l'origine de la lignée hydraulique HyQ et HyQReal. La cible applicative explicitement déclarée par les auteurs est l'exploration planétaire, domaine où l'ESA et la NASA cherchent activement des solutions de mobilité résiliente pour des rovers de nouvelle génération. Les approches concurrentes, notamment les politiques adaptatives basées sur l'estimation d'état développées par le Robotics Systems Lab de l'ETH Zurich sur ANYmal, n'exploitent pas aussi directement l'information de diagnostic pour router dynamiquement vers des experts dédiés par mode de panne. Le code est publié en open source sur GitHub (dépôt iit-DLSLab/fault-locomotion-isaaclab) sous IsaacLab, ce qui facilite la reproductibilité et l'adoption par la communauté. Prochaine étape attendue : validation sur plateforme physique, les résultats actuels étant entièrement en simulation.

UEL'IIT, laboratoire européen de référence en robotique à pattes, publie une architecture MoE open source pour la locomotion tolérante aux pannes, offrant une base directement exploitable pour les programmes de rovers résilients de l'ESA.

FR/EU ecosystemePaper

1 source

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation

51

2arXiv cs.RO

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation

Une équipe de chercheurs a publié TAVIS, un environnement d'évaluation standardisé pour comparer les approches de vision active en apprentissage par imitation, soit la capacité d'une politique robotique à contrôler son propre regard pendant une tâche de manipulation. Le benchmark comprend deux suites : TAVIS-Head (5 tâches avec caméra sur cardan pan/tilt pour la recherche globale de scène) et TAVIS-Hands (3 tâches avec caméras de poignet pour gérer les occlusions locales). Il est construit sur IsaacLab et s'appuie sur deux embodiments de torse humanoïde : le GR1T2 de Fourier Intelligence et le Reachy2 de Pollen Robotics (Bordeaux). Environ 2 200 épisodes de démonstrations téléopérées sont publiés en format LeRobot v3.0 sur HuggingFace, avec Diffusion Policy et π₀ (Physical Intelligence) comme baselines. Trois résultats principaux ressortent : la vision active améliore les performances, mais de façon conditionnelle à la tâche ; les politiques multi-tâches se dégradent nettement sous distribution shift contrôlé ; et l'imitation seule produit un regard anticipatoire dont les temps de préemption médians, mesurés par la métrique GALT (Gaze-Action Lead Time), sont comparables à ceux du téléopérateur humain de référence. Jusqu'ici, plusieurs groupes avaient démontré indépendamment les bénéfices de la vision active en 2024-2025, sans base commune de comparaison. TAVIS comble ce vide avec trois primitives reproductibles : un protocole comparatif caméra mobile/caméra fixe sur des démonstrations identiques, la métrique GALT issue des sciences cognitives et de l'HRI (Human-Robot Interaction), et des splits procéduraux in-distribution/out-of-distribution. Le constat que les gains sont task-conditional invalide l'hypothèse naïve qu'ajouter des degrés de liberté à la caméra améliore systématiquement les performances, nuance décisive pour les intégrateurs industriels. La fragilité sous distribution shift constitue un signal d'alarme concret pour tout déploiement hors simulation. La vision active en manipulation connaît un regain d'intérêt depuis 2024, porté par les progrès des VLA (Vision-Language-Action models) et la disponibilisation de robots humanoïdes à têtes articulées. Le choix de Reachy2 comme plateforme de référence est notable : Pollen Robotics, startup bordelaise fondée en 2016, est l'un des rares acteurs européens dont le robot open-source figure dans des benchmarks académiques internationaux, face aux concurrents américains (Figure, Agility) et asiatiques (Fourier, Unitree). Les prochaines étapes naturelles incluent l'évaluation de politiques VLA récentes comme GR00T N2 ou OpenVLA sur TAVIS, ainsi que le transfert sim-to-real, que le papier ne couvre pas encore.

UEPollen Robotics (Bordeaux) est l'une des deux seules plateformes de référence du benchmark TAVIS, ce qui ancre un acteur français open-source au cœur d'une infrastructure d'évaluation académique internationale pour les politiques VLA.

FR/EU ecosystemePaper

1 source

Chien robot quadrupède détecte les toxines dangereuses avant l'entrée des pompiers en zone à risque

47

3Interesting Engineering

Chien robot quadrupède détecte les toxines dangereuses avant l'entrée des pompiers en zone à risque

Des chercheurs de la Graz University of Technology (TU Graz) en Autriche ont développé un chien robot quadrupède capable de détecter des substances toxiques en zones dangereuses avant l'intervention des pompiers. Le système, téléopéré et compact, intègre des instruments de mesure déjà utilisés par les services d'incendie. Il a été testé lors d'exercices grandeur nature impliquant des scénarios de pollution chimique, où il a démontré sa capacité à transmettre des données en temps réel depuis des zones contaminées. Selon Gerald Steinbauer-Wagner, chercheur et professeur associé en robotique à la TU Graz, le robot mesure les concentrations de polluants et renvoie simultanément images caméra et relevés de capteurs pendant que les équipes s'équipent de leurs tenues de protection. Gerald Czech, de l'Association fédérale autrichienne des sapeurs-pompiers, a confirmé qu'en cas d'incident réel, il enverrait le robot dans la zone contaminée avant tout déploiement humain. L'enjeu opérationnel est significatif. Lors d'accidents chimiques, les pompiers doivent revêtir des combinaisons de protection lourdes de niveau A ou B avant toute mesure sur site, une procédure qui consomme un temps précieux dans des situations où chaque minute compte. Le robot comble ce délai en fournissant une évaluation précoce de la scène, ce qui permet au commandement de baser ses décisions sur des données réelles plutôt que sur des hypothèses. Ce gain d'information réduit l'exposition directe des équipes aux substances toxiques et améliore la conduite opérationnelle. Un point important : les concepteurs ont délibérément évité de créer un nouveau protocole de zéro, en intégrant le robot dans les procédures opérationnelles standard existantes des services Hazmat. Cela réduit la friction d'adoption, souvent sous-estimée dans les projets de robotisation des services d'urgence. Le projet bénéficie du soutien de l'Agence autrichienne de promotion de la recherche (FFG), ainsi que des associations de pompiers styriennes et de Haute-Autriche, et du Disaster Competence Network Austria. Le robot s'appuie exclusivement sur des composants commerciaux standard pour la mobilité, le traitement des données, la communication et la visualisation, ce qui favorise la reproductibilité et limite les coûts de maintenance. Les experts impliqués recommandent d'en faire un équipement permanent des unités Hazmat. Dans le paysage plus large des robots d'inspection et de sécurité, ce système s'inscrit dans une tendance croissante d'utilisation de plateformes quadrupèdes dérivées du Boston Dynamics Spot ou d'équivalents pour des missions de reconnaissance industrielle, une tendance que des acteurs comme ANYbotics ou Ghost Robotics ont déjà commercialisée dans le secteur de l'inspection d'infrastructures. La prochaine étape pour l'équipe de TU Graz serait d'étendre les tests à des scénarios d'incidents réels et de formaliser l'intégration dans les doctrines nationales de réponse aux matières dangereuses.

UELa TU Graz (Autriche) livre aux services Hazmat européens un système quadrupède validé en exercices grandeur nature, ouvrant la voie à une intégration dans les doctrines nationales de réponse aux matières dangereuses.

FR/EU ecosystemePaper

1 source

DuoBench : un benchmark reproductible pour la manipulation bimanuelles en simulation et dans le monde réel

52

4arXiv cs.RO

DuoBench : un benchmark reproductible pour la manipulation bimanuelles en simulation et dans le monde réel

Une équipe de chercheurs a publié en juin 2026 DuoBench, un cadre de benchmarking dédié à la manipulation bimanuelle, conçu pour la plateforme FR3 Duo de Franka Robotics. Le benchmark comprend onze tâches réparties en quatre catégories de coordination, implémentées en simulation et partiellement reproduites en environnement réel grâce à des protocoles reproductibles incluant des composants imprimables en 3D. Les auteurs ont constitué des jeux de données de télé-opération humaine pour l'ensemble des onze tâches, et proposent un schéma d'évaluation par étapes (stage-based evaluation) permettant une analyse sémantique fine des modes d'échec, au-delà du simple critère binaire succès/échec. Plusieurs politiques d'apprentissage par imitation à deux bras ainsi que des politiques VLA (vision-language-action) ont été évaluées en simulation et sur matériel réel. Les résultats sont sans ambiguïté : les politiques actuelles, y compris les approches VLA considérées comme l'état de l'art, restent insuffisantes pour la manipulation bimanuelle. Les échecs se concentrent sur trois axes : les phases d'interaction initiale, l'exécution parallèle des deux bras, et le transfert simulation-réel (sim-to-real). Ce dernier point est particulièrement significatif : malgré les progrès récents sur le gap sim-to-real pour la manipulation à un bras, DuoBench révèle que la coordination bimanuelle pose des défis supplémentaires non résolus. Pour les équipes R&D et les intégrateurs industriels, ce benchmark fournit un outil diagnostique structuré pour identifier précisément où les politiques échouent, une lacune que les frameworks existants comme RLBench ou LIBERO, conçus pour les systèmes à un seul bras, ne comblaient pas. La manipulation bimanuelle est un prérequis pour de nombreuses tâches complexes en industrie (assemblage, conditionnement, manipulation d'objets déformables), ce qui explique l'intérêt croissant du secteur pour les plateformes à deux bras. Le FR3 Duo de Franka Robotics est l'une des rares plateformes de recherche standardisées pour ce segment. Dans la course aux capacités bimanuelles, des acteurs comme Physical Intelligence avec Pi-0, NVIDIA avec GR00T N2, ou Figure AI avec ses robots humanoïdes ont annoncé des performances prometteuses, mais les benchmarks publics rigoureux permettant de les comparer restent rares. DuoBench, dont le code, les jeux de données et les vidéos sont disponibles sur duobench.github.io, ambitionne de combler ce manque avec un protocole reproductible que tout laboratoire peut répliquer à faible coût grâce aux assets imprimables en 3D.

UEFranka Robotics (Allemagne) est la plateforme centrale de DuoBench, offrant aux laboratoires et équipes R&D européens un benchmark standardisé et reproductible pour évaluer leurs politiques bimanuelle, y compris les approches VLA, sans disposer de ressources matérielles coûteuses.

FR/EU ecosystemePaper

1 source

Benchmark exclusivement proprioceptif pour l'estimation d'état des quadrupèdes : ATE, RPE et compromis entre filtres et lisseurs

À lire aussi

Apprentissage par renforcement avec mélange d'experts pour la locomotion quadrupède tolérante aux pannes

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation

Chien robot quadrupède détecte les toxines dangereuses avant l'entrée des pompiers en zone à risque

DuoBench : un benchmark reproductible pour la manipulation bimanuelles en simulation et dans le monde réel