Aller au contenu principal
RecherchearXiv cs.RO2h

S2M-Trek : du transport mono-sphère au multi-sphère par Deep Sets par image sur un robot roues-pattes

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de recherche présente S2M-Trek, un système permettant à un robot quadrupède à roues et pattes de transporter jusqu'à cinq sphères libres simultanément sur son dos, sans grilles, pinces ni butées mécaniques. L'article arXiv (2606.01332) adresse un problème précis en apprentissage par renforcement : plusieurs sphères identiques forment un ensemble non ordonné dont l'ordre peut changer à chaque frame d'historique, créant une symétrie de permutation par frame que les encodeurs Deep Sets à concaténation d'historique (HCDS) classiques ne capturent pas. Entraîné avec PPO sur un budget fixe, le HCDS de référence plafonne à deux sphères sans randomisation des assignations balle-slot ; les MLP plats et encodeurs par branche aussi. La solution proposée, Per-Frame Deep Sets (PFDS), applique un pooling invariant aux permutations à l'intérieur de chaque frame avant lecture temporelle, et les auteurs prouvent formellement son invariance et son approximation universelle des politiques continues invariantes. PFDS atteint le stade cinq sphères avec 100 % de transport sans chute en simulation sur cinq seeds aléatoires. Une distillation via DAgger produit TactSet, qui remplace l'état privilégié des sphères par une carte de contact booléenne 16×16, compacte et naturellement invariante.

Ce résultat révèle un biais structurel non trivial dans les encodeurs d'ensembles temporels : HCDS exploite les indices de slot comme raccourci de curriculum, simulant une généralisation sans apprendre une dynamique vraiment multi-objets sans identité persistante. L'ablation 2×2 (architecture × randomisation des données) montre que les deux corrections ne sont pas interchangeables : PFDS résout le problème architecturalement, indépendamment de l'augmentation de données. Pour les décideurs travaillant sur la manutention d'objets interchangeables en entrepôt ou en logistique, cela suggère que des politiques entraînées sur des configurations identifiées risquent d'échouer en déploiement réel où les objets sont physiquement indiscernables.

S2M-Trek s'inscrit dans la montée des robots à locomotion hybride roues-pattes capables de coupler dynamiquement locomotion et manipulation sans contrainte physique externe. L'approche TactSet, utilisant des cartes de contact binaires basse résolution pour remplacer des observations d'état simulées, ouvre une voie vers le déploiement hardware sans instrumentation coûteuse. Les travaux connexes incluent Transporter Networks et les approches d'RL équivariant, mais ce papier se distingue par le contexte de locomotion active sur objets libres non contraints. L'étape critique restante est le transfert sim-to-real : l'ensemble des résultats est exclusivement en simulation, et les auteurs ne rapportent aucune expérience physique sur robot réel.

Dans nos dossiers

À lire aussi

Transport d'objets par occlusion autour d'obstacles grâce à un essaim de robots miniatures
1arXiv cs.RO 

Transport d'objets par occlusion autour d'obstacles grâce à un essaim de robots miniatures

Des chercheurs ont publié sur arXiv (référence 2605.13006) une extension d'une stratégie existante de transport collectif par essaim robotique, permettant désormais aux robots de contourner des obstacles qui bloquent la ligne de vue vers la cible. Le système repose sur une approche dite par occlusion : chaque robot minuscule utilise sa capacité à détecter si l'objet à déplacer masque ou non la lumière émise par la balise-objectif pour décider de sa position et de sa poussée. La nouveauté consiste à permettre à n'importe quel membre de l'essaim de se positionner comme sous-objectif intermédiaire, formant ainsi une chaîne de relais visuels entre l'objet et la destination finale. Le comportement global émerge d'une machine à états finis individuelle et simple, sans aucune communication entre robots et sans coordinateur central. Cinq séries d'expériences simulées démontrent la robustesse du système face à des obstacles convexes et concaves, à des positions de départ variables et à différentes tailles de swarm. Cette approche lève la principale limite pratique des stratégies d'occlusion précédentes, qui exigeaient un couloir dégagé entre l'objet et la cible, une hypothèse rarement vérifiable dans un environnement industriel réel encombré de rayonnages, palettes ou machines. L'absence totale de communication entre agents élimine les goulots d'étranglement réseau et les points de défaillance uniques qui pénalisent les flottes d'AMR classiques dès que la densité de robots augmente. La capacité à traiter des obstacles concaves, géométriquement plus complexes, suggère une transposabilité raisonnable vers des configurations d'entrepôts non standardisés. Il convient cependant de noter que les résultats restent purement simulés : le fossé sim-to-real sur des robots physiques miniatures, avec friction, glissement et variabilité de capteurs, n'est pas encore adressé. La stratégie par occlusion pour transport en essaim a été posée par des travaux antérieurs, notamment dans les groupes travaillant sur les kilobots et les microbots à faibles ressources computationnelles. Ce domaine se distingue des approches multi-robots classiques (ROS 2, planification centralisée) par son paradigme ascendant, plus proche des algorithmes bio-inspirés type stigmergie. Les concurrents directs dans l'espace du transport collectif décentralisé incluent des travaux sur les robots vibratoires de Harvard et les systèmes de manipulation collective du MIT CSAIL. La prochaine étape logique annoncée implicitement par les auteurs est la validation sur hardware réel, où les contraintes physiques des robots miniatures rendront les résultats réellement exploitables par les intégrateurs de solutions de manutention autonome.

RecherchePaper
1 source
Transport multi-robots de boîtes sur différentes surfaces avec contrôle proportionnel décentralisé basé sur les rôles
2arXiv cs.RO 

Transport multi-robots de boîtes sur différentes surfaces avec contrôle proportionnel décentralisé basé sur les rôles

Des chercheurs ont publié sur arXiv (référence 2605.26430) R2P2 (Roles with Rules and Proportional-control Primitive), une architecture décentralisée pour le transport collaboratif de caisses rectangulaires par plusieurs robots agissant par poussée, sans préhension. Le système assigne dynamiquement trois rôles distincts à chaque robot - pousser, soutenir ou bloquer - selon le mode de manipulation requis : rotation ou translation de la caisse. R2P2 a été évalué en simulation sur NVIDIA IsaacSim avec une équipe de six robots, testée sur des surfaces planes, en montée et en descente avec des variations de friction et de masse de caisse. La validation physique implique quatre TurtleBots déplaçant une caisse de 1,2 kg. Les auteurs revendiquent un meilleur taux de succès que l'approche de référence par leader-suiveur virtuel, sans préciser de métriques chiffrées au-delà des graphes de comparaison. L'élément différenciant clé est l'architecture décentralisée : chaque robot prend ses décisions localement en observant uniquement sa propre position et celle de la caisse, sans communication inter-robots, consensus ou coordinateur central. Cela élimine le point de défaillance unique et réduit les contraintes de synchronisation critiques pour un déploiement en entrepôt ou en zone sinistrée. La gestion simultanée d'inclinaison et de friction variables représente un défi rarement traité dans la littérature, où la plupart des démonstrateurs fonctionnent sur sol plat homogène. La validation sim-to-real, même à petite échelle, confirme que le contrôle proportionnel basé sur les rôles reste transposable au matériel réel - un résultat non trivial pour une méthode sans apprentissage. Le transport collaboratif par poussée est un problème ouvert en robotique multi-agents depuis les années 1990, qui regagne de l'intérêt avec la montée en puissance des flottes AMR dans la logistique et la construction. Les approches concurrentes incluent les méthodes par leader-suiveur centralisé, les algorithmes de consensus distribué et, plus récemment, le renforcement multi-agent. R2P2 se positionne comme une solution légère, interprétable et sans phase d'entraînement, un avantage pour les intégrateurs qui privilégient la prédictibilité et la facilité de certification. NVIDIA IsaacSim, utilisé ici pour les tests en simulation, est devenu la plateforme de référence pour la validation robotique, notamment adoptée par Figure, Boston Dynamics et 1X. Les auteurs ne mentionnent pas de déploiement industriel ni de partenariats : il s'agit d'une contribution académique, avec comme suites logiques des tests sur des charges plus lourdes, des géométries irrégulières et des équipes plus importantes.

RecherchePaper
1 source
MUJICA : architecture de contrôle unifiée multi-compétences pour robots hybrides roues-pattes
3arXiv cs.RO 

MUJICA : architecture de contrôle unifiée multi-compétences pour robots hybrides roues-pattes

Des chercheurs ont publié sur arXiv (référence 2605.13058) un framework de contrôle unifié pour robots à roues et pattes, baptisé MUJICA (Multi-skill Unified Joint Integration of Control Architecture). L'architecture regroupe en une seule politique trois compétences locomotrices distinctes : déplacement omnidirectionnel, escalade de plateformes élevées et récupération après chute. Chaque compétence est identifiée par des variables indicatrices propres et entraînée conjointement avec une modélisation précise des contraintes des moteurs à courant continu. Un sélecteur de compétences de haut niveau apprend ensuite à choisir dynamiquement la compétence optimale à partir de la seule proprioception, sans caméra ni LiDAR. Les expériences ont été conduites en simulation puis sur le robot Unitree Go2-W, la variante à roues du quadrupède Go2 commercialisé par Unitree Robotics. Ce travail adresse un problème structurel des robots hybrides roues-pattes : alterner entre contrôle roulant et contrôle locomoteur sans transitions abruptes ni dégradation de performance aux limites mécaniques des actionneurs. Le bruit proprioceptif et les contraintes réelles des moteurs rendent cette robustesse difficile à obtenir, particulièrement lors du transfert sim-to-real. MUJICA améliore ce transfert en intégrant un modèle DC-moteur précis dès la phase d'entraînement, ce qui réduit l'écart entre simulation et déploiement physique. Pour un intégrateur industriel ou un COO logistique, cela signifie un robot hybride capable de naviguer de façon autonome dans des environnements non structurés (entrepôts encombrés, chantiers, zones mixtes) sans reconfigurations manuelles entre modes de déplacement. Le Unitree Go2-W est l'une des rares plateformes commerciales hybrides roues-pattes accessibles (le Go2 standard est vendu entre 1 600 et 2 700 USD selon configuration), ce qui en fait un banc de test pertinent pour la reproductibilité. Dans la compétition plus large sur la locomotion adaptative, des acteurs comme ANYbotics (ANYmal), Boston Dynamics (Spot) ou des équipes académiques de l'ETH Zurich et de Carnegie Mellon développent des approches concurrentes, souvent basées sur vision ou LiDAR. MUJICA se distingue par son pari sur la proprioception seule, choix réaliste pour des déploiements sans infrastructure sensorielle lourde. L'article restant un preprint non évalué par des pairs, les métriques de performance en conditions réelles devront être confirmées lors d'une soumission en conférence (IROS, ICRA ou CoRL).

RecherchePaper
1 source
Affection robotique : opportunités de l'IA haptique pour le toucher social des robots par approche multi-deep-learning
4arXiv cs.RO 

Affection robotique : opportunités de l'IA haptique pour le toucher social des robots par approche multi-deep-learning

Une équipe de chercheurs propose, dans un article de positionnement déposé sur arXiv en mai 2025 (arXiv:2605.02538), une architecture multi-modèles pour traiter le toucher social affectif en robotique. Le problème ciblé est précis : si la préhension et la dextérité robotiques ont significativement progressé grâce au retour haptique, les gestes affectifs - poignées de main, caresses rassurantes, contacts sociaux codifiés - restent non résolus en interaction humain-robot (HRI). Les auteurs proposent de décomposer le toucher affectif en sous-tâches spécialisées, chacune traitée par un modèle dédié, dans une architecture distribuée en boucle fermée inspirée de la neurobiologie. Ce cadre repose sur un protocole de partage d'état pair-à-pair et s'intègre dans un pipeline Sim-to-Real pour faciliter le transfert de l'entraînement en simulation vers les plateformes physiques. Il s'agit à ce stade d'un cadre conceptuel sans validation expérimentale publiée. Le verrou adressé est réel : un robot capable de saisir un objet de cinq kilos avec précision peut échouer à simuler une poignée de main naturelle. Les auteurs introduisent la notion de "vallée de l'étrange haptique" (haptic uncanny valley), par analogie avec son équivalent visuel - un toucher robotique "presque juste" génère un inconfort plus marqué qu'un contact clairement artificiel. L'approche multi-modèles distribuée, à l'opposé d'un mouvement moteur monolithique, permettrait un développement cumulatif et modulaire : les équipes spécialisées en haptique, en IA et en robotique peuvent contribuer indépendamment. Pour les intégrateurs de robots sociaux dans les secteurs médical, thérapeutique ou d'assistance à la personne, cela ouvre une voie vers des interactions physiques acceptables et objectivement mesurables. La robotique sociale s'est longtemps concentrée sur l'expressivité faciale et vocale - Pepper de SoftBank Robotics, Paro de l'AIST japonais - en laissant le toucher en marge. Les travaux sur le retour haptique dans la manipulation (MIT, Stanford) ont ouvert la voie, mais sans cibler spécifiquement la dimension affective. Les acteurs industriels aujourd'hui dominants - Figure AI avec Figure 02, Boston Dynamics, 1X Technologies - concentrent leurs efforts sur la locomotion et la manipulation de charges, pas sur la qualité sociale du contact physique. Ce papier de positionnement structure un agenda de recherche interdisciplinaire dont les prochaines étapes attendues seront l'implémentation et l'évaluation sur des robots compagnons ou d'assistance, segments où des acteurs européens comme Enchanted Tools (France) et des projets d'assistance à la dépendance commencent à émerger.

UELa proposition d'un cadre modulaire pour le toucher affectif représente une piste de R&D pertinente pour des acteurs français comme Enchanted Tools, actifs sur les robots d'assistance et de compagnie.

RecherchePaper
1 source