WiXus : un robot à roues et pattes utilisant des câbles…

CoStream : combiner des comportements simples pour une manipulation complexe et généralisable

45

1arXiv cs.RO

CoStream : combiner des comportements simples pour une manipulation complexe et généralisable

Une équipe de chercheurs propose CoStream (arXiv 2606.26423), un cadre de manipulation robotique conçu pour atteindre simultanément précision millimétrique et généralisation à de nouvelles tâches. L'article cible des opérations d'assemblage à haute contrainte de contact comme l'insertion d'un GPU dans un slot PCIe, où les approches existantes échouent sur au moins l'un des deux critères. Le système a été validé sur 8 tâches réelles couvrant manipulation quotidienne et assemblage de précision, avec récupération robuste après perturbations manuelles en cours d'exécution. L'apport central est de rompre avec deux paradigmes dominants : les pipelines classiques, précis mais rigides et coûteux à adapter à chaque nouvelle tâche, et les politiques end-to-end monolithiques, généralisables mais insuffisamment précises hors-distribution sans réentraînement. CoStream orchestre modèles de fondation et modalités de capteurs variées en trois comportements composables : sémantique (extraction de contraintes spatiales via modèles de fondation), prédictif (estimation de trajectoires par tracking de keypoints dans des vidéos imaginées) et réactif (corrections tactiles et de force haute fréquence). Ces sorties se composent par right-multiplication dans l'espace SE(3), produisant une commande de pose unique à chaque pas de contrôle, exécutée par un contrôleur compliant. Les gains les plus significatifs sont observés sur les tâches d'assemblage avec contact et de transfert d'objets, précisément là où la précision et l'adaptabilité sont le plus difficiles à concilier. CoStream s'inscrit dans la tendance qui cherche à exploiter les modèles de fondation visuels et linguistiques pour la planification robotique, tout en conservant des contrôleurs bas niveau fiables pour l'exécution temps réel. Les approches concurrentes les plus directes sont les VLA monolithiques comme pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, ainsi que les pipelines hiérarchiques classiques. La décomposition modulaire proposée n'implique pas de réentraînement complet pour chaque nouvelle tâche, ce qui constitue le principal argument de rupture avancé par les auteurs. L'article reste un preprint de recherche sans déploiement industriel annoncé ni partenaire de production mentionné ; les performances à l'échelle et hors environnement de laboratoire contrôlé restent à démontrer.

RecherchePaper

1 source

Bench-Push : benchmark pour la navigation et la manipulation par poussée des robots mobiles

45

2arXiv cs.RO

Bench-Push : benchmark pour la navigation et la manipulation par poussée des robots mobiles

Une équipe de chercheurs a publié Bench-Push (arXiv:2512.11736), le premier benchmark unifié dédié à l'évaluation des robots mobiles capables de pousser et de manipuler des objets dans leur environnement immédiat. La suite comprend quatre environnements de simulation aux niveaux de complexité variables : navigation en labyrinthe avec obstacles mobiles, navigation autonome de navire en eaux glacées, livraison de caisses, et nettoyage de zones encombrées. Bench-Push intègre également un jeu de métriques originales conçues pour mesurer l'efficacité, l'effort d'interaction mécanique et la complétion partielle des tâches, ainsi que des démonstrations de baselines établies. La bibliothèque est open-source, distribuée sous Python avec une architecture modulaire, et disponible sur GitHub (IvanIZ/BenchNPIN). L'absence de référentiel commun dans ce domaine constitue un frein réel : jusqu'ici, chaque équipe évaluait ses approches sur des configurations ad hoc, rendant toute comparaison inter-laboratoires impossible et la reproductibilité aléatoire. Or la question est loin d'être académique. Les robots mobiles autonomes (AMR) déployés en logistique, en entrepôt ou en milieu industriel se retrouvent régulièrement dans des espaces encombrés d'objets déplaçables que les algorithmes classiques d'évitement d'obstacles ne savent tout simplement pas gérer. Les stratégies de poussée (pushing, nudging) constituent une compétence clé pour ces environnements réels, et Bench-Push offre désormais un terrain de comparaison structuré pour les évaluer. La métrique de complétion partielle est notamment utile pour les décideurs B2B, qui ont besoin de quantifier la dégradation progressive des performances plutôt qu'un simple succès ou échec binaire. Le champ dit NAMO (Navigation Among Movable Obstacles) connaît une croissance soutenue, mais restait fragmenté faute d'outil fédérateur. Bench-Push s'inscrit dans la continuité des efforts de standardisation observés ailleurs en robotique, à l'image de ce que RoboSuite ou Isaac Gym ont apporté à la manipulation. L'inclusion d'un scénario de navigation en eaux glacées témoigne d'une ambition d'élargissement au-delà de la robotique d'entrepôt stricte, vers des domaines comme la navigation maritime autonome. Il n'existe à ce stade aucune annonce de déploiement industriel : Bench-Push est un outil de recherche, mais sa conception modulaire et son accessibilité via pip en font un candidat sérieux à une adoption rapide par les équipes travaillant sur la planification en environnements dynamiques.

RecherchePaper

1 source

FT-WBC : apprentissage d'un contrôle corps entier tolérant aux défaillances pour la loco-manipulation de robots à pattes

45

3arXiv cs.RO

FT-WBC : apprentissage d'un contrôle corps entier tolérant aux défaillances pour la loco-manipulation de robots à pattes

Des chercheurs ont publié le 24 juin 2026 sur arXiv (référence 2606.24466) un cadre de contrôle baptisé FT-WBC (Fault-Tolerant Whole-Body Control), conçu pour maintenir la stabilité et la capacité de manipulation des robots à pattes équipés d'un bras lorsqu'un ou plusieurs actionneurs tombent en panne. Le système repose sur une architecture à politiques découplées haut/bas du corps, et intègre deux modules clés : un Fault Estimator (FE), qui prédit les articulations défaillantes à partir de l'historique proprioceptif du train inférieur, et un Posture Adaptation Module (PAM), qui convertit les commandes de posture potentiellement déstabilisantes générées par la politique du bras en commandes sûres et exécutables pour le torse. Les expériences en simulation et sur robot réel montrent une amélioration significative du taux de survie et du volume d'espace de travail atteignable sous deux régimes de panne : actionneur affaibli (weakening failure) et actionneur bloqué (locked failure). Le transfert sim-to-real s'effectue en zero-shot, sans ré-entraînement. L'enjeu central de ce travail est le couplage entre stabilité locomotrice et accessibilité du bras lors d'une dégradation matérielle, un problème que les méthodes de tolérance aux pannes existantes laissaient largement non résolu, car elles traitaient la locomotion seule. Dans un déploiement industriel ou de service réel, les défaillances d'actionneurs ne sont pas des scénarios théoriques : elles surviennent sur des robots en fonctionnement prolongé, en environnements poussiéreux ou sous contraintes mécaniques répétées. Le fait que FT-WBC préserve autant que possible l'espace de travail du bras tout en synthétisant une allure compensatoire est un signal concret que la robustesse opérationnelle des manipulateurs à pattes commence à être prise en compte au niveau du contrôle, et pas seulement au niveau mécanique. Le domaine de la loco-manipulation sur pattes s'est structuré autour de plateformes comme l'ANYmal de ANYbotics équipé du bras HEBI, le Spot d'Boston Dynamics avec Spot Arm, ou encore l'Unitree B2-W. Ces systèmes ont démontré leur mobilité en terrain non structuré, mais leur robustesse aux pannes en cours de tâche reste un angle mort de la littérature. FT-WBC s'inscrit dans une tendance de recherche qui vise à rapprocher les conditions de laboratoire des conditions réelles d'exploitation, notamment pour les applications d'inspection industrielle, de manutention en entrepôt ou d'intervention en environnements à risque. L'article ne mentionne pas de partenaires industriels ni de calendrier de commercialisation : il s'agit pour l'instant d'un résultat académique, dont la validation reste limitée aux scénarios présentés dans le papier.

RecherchePaper

1 source

Glissement d'objets par manipulation des pieds sur un robot bipède à roues avec contrôle hiérarchique

37

4arXiv cs.RO

Glissement d'objets par manipulation des pieds sur un robot bipède à roues avec contrôle hiérarchique

Des chercheurs ont publié sur arXiv (arXiv:2606.19233, juin 2026) un framework de contrôle hiérarchique permettant à des robots bipèdes à roues d'effectuer des tâches de manipulation d'objets au sol à l'aide de leurs membres inférieurs motorisés, une capacité baptisée "pédimanipulation mobile". Le système repose sur un contrôleur prédictif non linéaire (NMPC) construit sur un modèle dynamique simplifié à trois corps rigides (TRB), intégrant explicitement le degré de liberté en roulis de hanche et plusieurs modes de contact roue-sol. En expérimentation réelle, le robot a récupéré un objet de 1 kg coincé sous un bureau et déplacé latéralement un objet de 4 kg sur une distance de 0,228 m via une motion de type "scooting". Deux primitives de mouvement ont été validées sur hardware : scooting (poussée frontale par rotation des roues) et lateral sliding (déplacement latéral par pas de côté). L'intérêt industriel de cette approche réside dans sa réutilisation du train roulant comme effecteur de manipulation, sans bras supplémentaire ni outil dédié. Le NMPC régule simultanément la locomotion et les forces d'interaction, ce qui signifie que le robot maintient son équilibre tout en exerçant un effort contrôlé sur l'objet, un problème de couplage non trivial. Le planificateur de trajectoire intègre les transitions adhérence-glissement (stick-slip) dans le contact sol-objet, un phénomène souvent ignoré dans les démos en simulation mais critique en conditions réelles. C'est un résultat concret qui réduit le demo-to-reality gap sur la manipulation au sol, habituellement dominée par les manipulateurs à bras. Les robots bipèdes à roues constituent une architecture émergente entre AMR classiques et humanoïdes complets : Agility Robotics (Digit), Boston Dynamics (Spot avec extension roues dans certaines configs), et des plateformes académiques comme le Cassie de l'Oregon State University ont popularisé cette morphologie. Ce travail s'inscrit dans un courant de recherche sur la pédimanipulation, utiliser les jambes comme manipulateurs, que l'on retrouve aussi sur quadrupèdes (ANYmal, Go2). La prochaine étape probable est l'extension à des objets non rigides ou à des surfaces non planes, ainsi que l'intégration de perception pour fermer la boucle en environnement non structuré.

RecherchePaper

1 source

WiXus : un robot à roues et pattes utilisant des câbles pour combiner mobilité et manipulation

À lire aussi

CoStream : combiner des comportements simples pour une manipulation complexe et généralisable

Bench-Push : benchmark pour la navigation et la manipulation par poussée des robots mobiles

FT-WBC : apprentissage d'un contrôle corps entier tolérant aux défaillances pour la loco-manipulation de robots à pattes

Glissement d'objets par manipulation des pieds sur un robot bipède à roues avec contrôle hiérarchique