RecherchearXiv cs.RO6sem

MOBIUS : un robot bipède multimodal capable de marcher, ramper, grimper et rouler

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2511.01774, version 3 de mai 2026) la plateforme MOBIUS, un robot bipède à quatre membres capable d'enchaîner marche, reptation, escalade et déplacement sur roues sans reconfiguration mécanique. La plateforme embarque deux bras à 6 degrés de liberté (6-DoF) équipés de préhenseurs à deux doigts pour la manipulation et l'escalade, ainsi que deux jambes à 4-DoF pour la locomotion. Une architecture de contrôle hybride combine apprentissage par renforcement pour les transitions de gait et contrôle en force pour les interactions de contact compliantes lors des phases de manipulation. Un planificateur haut niveau de type MIQCP (Mixed-Integer Quadratically Constrained Program) sélectionne automatiquement le mode de locomotion optimal selon des critères de stabilité et d'efficacité énergétique. Les expériences sur prototype physique montrent des transitions de marche robustes, une escalade dynamique et un support de charge sur l'ensemble du corps par préhension en pince.

Ce travail s'attaque à l'un des verrous historiques de la robotique mobile : la plupart des plateformes humanoïdes ou quadrupèdes sont optimisées pour un seul mode de déplacement, ce qui limite leur traversabilité réelle en environnement industriel non structuré. MOBIUS démontre qu'une intégration serrée entre morphologie, planification autonome et contrôle multi-modal peut étendre substantiellement l'espace de travail et les capacités d'interaction d'un robot sans multiplier les actionneurs. Pour un intégrateur B2B, le signal est clair : le paradigme "un robot, un usage" n'est plus une contrainte technique incontournable. Il convient toutefois de noter que les démonstrations restent en contexte laboratoire contrôlé ; aucune donnée de déploiement industriel n'est communiquée à ce stade.

MOBIUS s'inscrit dans un courant de recherche en pleine expansion autour des robots loco-manipulateurs, aux côtés de travaux comme ANYmal (ETH Zurich), Spot ARM (Boston Dynamics) ou les plateformes du CMU Robotics Institute. La singularité de MOBIUS réside dans sa capacité à rouler, ce qui le rapproche également des robots hybrides roues-pattes (wheeled-legged) comme Ascento ou Rezero. Aucun partenaire industriel ni calendrier de commercialisation n'est mentionné dans l'article, ce qui en fait pour l'instant une contribution académique solide plutôt qu'une annonce produit. Les prochaines étapes naturelles seraient des tests en environnement semi-structuré (entrepôt, chantier) et une validation de la robustesse du planificateur MIQCP face à des perturbations imprévues.

Dans nos dossiers

Boston Dynamics arXiv cs.RO

À lire aussi

1arXiv cs.RO

WiXus : un robot à roues et pattes utilisant des câbles pour combiner mobilité et manipulation

Des chercheurs japonais ont publié sur arXiv (arXiv:2505.20932, mai 2025) les travaux décrivant WiXus, un robot à roues et pattes qui intègre un mécanisme de traction par câbles fixés à l'environnement extérieur. L'architecture combine un châssis à locomotion hybride roues-pattes, configuration classique permettant déplacement rapide sur sol plan, avec des câbles motorisés que le robot ancre sur des structures environnantes (murs, arêtes, supports). En phase de démonstration, WiXus effectue une mobilité tridimensionnelle incluant l'escalade de falaises en coordonnant entraînement par câbles et actionnement roues-pattes. Plus distinctif : une fois son corps suspendu par les câbles, le robot libère ses membres inférieurs de toute fonction locomotrice et les repurpose en bras manipulateurs. Les tâches démontrées restent à l'échelle prototype, saisir une peluche (simulation de sauvetage) et couper une fausse pomme avec un sécateur. Aucun chiffre de charge utile, de degrés de liberté (DOF) précis ou de temps de cycle n'est fourni dans l'abstract publié. Le principe architectural est notable pour les intégrateurs robotiques : découpler locomotion et manipulation par un support externe résout une contrainte fondamentale des plateformes à pattes, qui doivent traditionnellement arbitrer entre stabilité posturale et liberté d'effecteur. En suspendant le corps via l'environnement, WiXus contourne cette contrainte sans ajouter de bras dédiés, ce qui réduit la masse embarquée et la complexité mécanique. Pour les décideurs industriels, la question critique reste la fiabilité de l'ancrage câble en environnement non préparé, un point que les démonstrations actuelles, conduites en conditions de laboratoire contrôlées, ne permettent pas encore de valider. WiXus s'inscrit dans une dynamique académique large autour des robots à mobilité hybride. Des plateformes comme ANYmal (ANYbotics), Spot (Boston Dynamics) ou Unitree B2 dominent le marché des robots à pattes, mais restent dédiés à la locomotion avec manipulation optionnelle par bras additionnel. L'approche câble-environnement rappelle des travaux sur les robots grimpeurs (ex. ETH Zurich, IIT Gênes) et les AMR avec bras intégré. WiXus reste au stade de prototype de recherche ; aucun partenaire industriel ni calendrier de commercialisation ne sont mentionnés.

RecherchePaper

1 source

2arXiv cs.RO

AssemLM : un modèle de langage multimodal pour le raisonnement spatial en assemblage robotique

Des chercheurs ont publié AssemLM (arXiv:2604.08983), un modèle multimodal de raisonnement spatial pour la robotique d'assemblage. Le système fusionne trois sources (manuels d'assemblage, nuages de points 3D, instructions textuelles) pour prédire des poses 6D, c'est-à-dire la position et l'orientation complètes d'une pièce dans l'espace tridimensionnel. Un encodeur de nuages de points spécialisé extrait des caractéristiques géométriques et rotationnelles fines, transmises ensuite à un LLM multimodal pour le raisonnement spatial de haut niveau. Les auteurs publient également AssemBench, un benchmark de plus de 900 000 échantillons multimodaux avec annotations de poses 6D précises, étendant l'évaluation classique du grounding 2D à l'inférence géométrique 3D complète. Des tests sur robot réel valident des performances à l'état de l'art sur des tâches d'assemblage multi-étapes en conditions réelles. Le verrou ciblé est central en manipulation fine industrielle: les VLMs courants opèrent sur des images 2D et peinent à raisonner sur la géométrie précise qu'exigent le vissage, l'emboîtement ou l'alignement de composants au sous-millimètre. En intégrant les nuages de points comme modalité native, AssemLM raisonne sur l'orientation exacte d'une pièce, pas seulement sur sa présence dans le champ visuel. Pour un intégrateur ou une équipe R&D en automatisation industrielle, prédire des poses 6D depuis un manuel PDF et une capture 3D ouvre la voie à des cellules d'assemblage reconfigurables sans reprogrammation manuelle entre chaque référence produit. AssemBench, avec ses 900 000 échantillons annotés, comble par ailleurs un manque d'infrastructure de comparaison rigoureuse dans ce sous-domaine. Le raisonnement spatial est un défi persistant pour les modèles de vision-langage, majoritairement entraînés sur des tâches 2D (captioning, grounding d'objets, VQA). Les modèles VLA (Vision-Language-Action) récents, comme pi0 de Physical Intelligence, OpenVLA ou les travaux de Google DeepMind sur RoboVLMs, progressent sur la manipulation généraliste, mais l'assemblage industriel structuré avec ses contraintes de précision sub-millimétrique reste peu adressé par ces approches. AssemLM se positionne dans cette niche en ciblant explicitement les tâches avec documentation formalisée (manuels, nomenclatures). Les auteurs annoncent la mise à disposition publique du code, des modèles et du dataset AssemBench, point d'entrée potentiel pour la communauté académique et les industriels souhaitant affiner le modèle sur leurs propres composants. Aucun partenaire industriel ni déploiement commercial n'est mentionné: il s'agit à ce stade d'une publication de recherche, sans produit ni pilote planifié.

UELa publication en open-source d'AssemBench (900 000 échantillons annotés 6D) constitue une ressource d'entraînement et d'évaluation directement exploitable par les labos européens travaillant sur la manipulation industrielle précise, sans acteur FR/EU impliqué à ce stade.

RechercheOpinion

1 source

3arXiv cs.RO

Glissement d'objets par manipulation des pieds sur un robot bipède à roues avec contrôle hiérarchique

Des chercheurs ont publié sur arXiv (arXiv:2606.19233, juin 2026) un framework de contrôle hiérarchique permettant à des robots bipèdes à roues d'effectuer des tâches de manipulation d'objets au sol à l'aide de leurs membres inférieurs motorisés, une capacité baptisée "pédimanipulation mobile". Le système repose sur un contrôleur prédictif non linéaire (NMPC) construit sur un modèle dynamique simplifié à trois corps rigides (TRB), intégrant explicitement le degré de liberté en roulis de hanche et plusieurs modes de contact roue-sol. En expérimentation réelle, le robot a récupéré un objet de 1 kg coincé sous un bureau et déplacé latéralement un objet de 4 kg sur une distance de 0,228 m via une motion de type "scooting". Deux primitives de mouvement ont été validées sur hardware : scooting (poussée frontale par rotation des roues) et lateral sliding (déplacement latéral par pas de côté). L'intérêt industriel de cette approche réside dans sa réutilisation du train roulant comme effecteur de manipulation, sans bras supplémentaire ni outil dédié. Le NMPC régule simultanément la locomotion et les forces d'interaction, ce qui signifie que le robot maintient son équilibre tout en exerçant un effort contrôlé sur l'objet, un problème de couplage non trivial. Le planificateur de trajectoire intègre les transitions adhérence-glissement (stick-slip) dans le contact sol-objet, un phénomène souvent ignoré dans les démos en simulation mais critique en conditions réelles. C'est un résultat concret qui réduit le demo-to-reality gap sur la manipulation au sol, habituellement dominée par les manipulateurs à bras. Les robots bipèdes à roues constituent une architecture émergente entre AMR classiques et humanoïdes complets : Agility Robotics (Digit), Boston Dynamics (Spot avec extension roues dans certaines configs), et des plateformes académiques comme le Cassie de l'Oregon State University ont popularisé cette morphologie. Ce travail s'inscrit dans un courant de recherche sur la pédimanipulation, utiliser les jambes comme manipulateurs, que l'on retrouve aussi sur quadrupèdes (ANYmal, Go2). La prochaine étape probable est l'extension à des objets non rigides ou à des surfaces non planes, ainsi que l'intégration de perception pour fermer la boucle en environnement non structuré.

RecherchePaper

1 source

4arXiv cs.RO

Surveillance respiratoire sans contact sur robots mobiles hétérogènes : un cadre multimodal de calcul embarqué

Des chercheurs ont publié le 17 juin 2026 sur arXiv (réf. 2606.17376) un cadre logiciel de surveillance respiratoire sans contact déployé sur des robots mobiles hétérogènes embarquant des unités de calcul en périphérie (edge computing). Le système mesure la fréquence respiratoire (FR) d'une victime sans capteur porté ni contact physique, en combinant quatre modalités d'imagerie : RGB, thermique, proche infrarouge (NIR) et caméra basse lumière. Une sélection adaptative au niveau lumineux choisit automatiquement la modalité optimale, tandis qu'un module d'extraction de région d'intérêt thoracique guidé par points-clés squelettiques garantit la robustesse aux changements de posture. Un indice de qualité de signal (SQI) filtre les estimations peu fiables avant transmission. Le cadre a été évalué sur trois plateformes robotiques couvrant la locomotion quadrupède et à roues, sans recalibration algorithmique par plateforme. Les portées opérationnelles mesurées sont : RGB jusqu'à 8 m, NIR jusqu'à 6 m, thermique efficace uniquement à courte distance, basse lumière jusqu'à 8 m en obscurité totale. Ce travail répond à un verrou opérationnel concret : lors d'opérations de recherche et sauvetage (SAR) ou de triage en zone contaminée, équiper chaque victime d'un capteur porté est impraticable, et l'exposition des secouristes doit être minimisée. Démontrer qu'un robot mobile standard peut estimer la fréquence respiratoire de manière fiable à plusieurs mètres, sur des sujets en postures variées et dans des conditions d'éclairage dégradées, valide une brique essentielle du triage autonome. La portabilité sans retuning entre plateformes hétérogènes est un résultat notable : elle suggère une intégration possible sur des robots existants via une couche logicielle, sans exiger un matériel dédié. Les limites thermiques à courte portée restent cependant un point de vigilance pour les environnements chauds ou encombrés. Le domaine du triage autonome en SAR mobilise plusieurs équipes académiques et industriels depuis la catastrophe de Fukushima (2011), qui avait mis en évidence le manque de robots capables d'évaluer l'état de victimes sans intervention humaine directe. Dans l'espace des robots d'intervention, Boston Dynamics (Spot), ANYbotics (ANYmal) et Ghost Robotics fournissent des plateformes quadrupèdes sur lesquelles ce type de module pourrait se greffer. Côté français, les travaux du LAAS-CNRS et d'entreprises comme Shark Robotics (robots d'intervention COLOSSUS) s'inscrivent dans ce continuum. Les prochaines étapes logiques incluent la validation sur victimes réelles en exercice USAR (Urban Search and Rescue), l'intégration avec des modules de détection de signe de vie supplémentaires (pouls, mouvement), et le passage à des plateformes certifiées pour les environnements ATEX ou CBRN.

UELes équipes françaises LAAS-CNRS et Shark Robotics, actives sur les robots d'intervention, pourraient intégrer ce framework logiciel sans recalibration sur leurs plateformes existantes pour renforcer les capacités de triage autonome en opérations SAR.

RecherchePaper

1 source