Aller au contenu principal
RecherchearXiv cs.RO53min

Vers une navigation socialement adaptée dans les immeubles résidentiels : la méthode Look Further

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (réf. 2605.26710) une étude portant sur la navigation sociale d'un robot de livraison dans les couloirs d'immeubles résidentiels. L'approche centrale, baptisée Proactive Lane-Changing (PLC), consiste à déporter latéralement le robot du centre vers le côté du couloir dès qu'un piéton est détecté à plus de huit mètres, soit deux à quatre fois la distance de réaction habituelle des systèmes actuels. Une étude utilisateur avec 42 participants a évalué cette stratégie selon trois critères : sécurité, fluidité et politesse. En couloir droit (approche frontale), le PLC surpasse de façon statistiquement significative les comportements classiques de la littérature - ralentissement, arrêt, évitement réactif en proximité - sur les trois dimensions. En revanche, dans les scénarios d'intersection à angle mort, aucune des approches testées ne se distingue, les préférences des participants restant très dispersées.

Ce résultat interroge les intégrateurs de robots AMR en milieu indoor résidentiel. La navigation sociale s'est longtemps concentrée sur la zone de "personal space" - typiquement moins de deux mètres - en appliquant des règles d'évitement réactif. L'étude démontre qu'étendre la distance de réaction modifie la perception globale du mouvement robotique, pas uniquement la sensation d'intrusion à courte portée. C'est un signal utile pour les concepteurs de comportements : l'expérience utilisateur en couloir relève du design d'interaction à grande échelle spatiale, pas seulement de la sécurité physique. L'absence de résultat probant aux intersections souligne cependant que le problème des angles morts reste entier et que le PLC n'est pas une solution universelle.

Le travail s'inscrit dans un champ actif depuis la popularisation des robots de service indoor et l'émergence de modèles comme le Social Force Model. Côté industrie, des acteurs comme Keenon, Aethon ou Savioke ont déployé des robots de livraison en hôtellerie et milieu hospitalier sans traiter explicitement la navigation sociale à longue distance. En Europe, Enchanted Tools (France, robot Miroka) et d'autres opèrent dans des environnements comparables et pourraient bénéficier de ce type d'approche comportementale. L'étude reste au stade de la recherche publiée : ni code disponible, ni déploiement commercial annoncé.

Impact France/UE

Enchanted Tools (France, robot Miroka) et d'autres acteurs européens de robots de service indoor pourraient intégrer l'approche PLC pour améliorer la navigation sociale à longue distance dans les couloirs résidentiels.

À lire aussi

COLSON : navigation sociale contrôlable par apprentissage par renforcement basé sur la diffusion
1arXiv cs.RO 

COLSON : navigation sociale contrôlable par apprentissage par renforcement basé sur la diffusion

Des chercheurs proposent COLSON (Controllable Learning-based Social Navigation), une méthode de navigation sociale pour robots mobiles autonomes (AMR) en milieux piétons, fondée sur l'apprentissage par renforcement couplé à des modèles de diffusion. Publiée sur arXiv (2503.13934v2), cette étude traite d'un verrou persistant pour les robots de service : naviguer de façon fluide et socialement cohérente parmi des piétons dynamiques, sans violer leurs espaces de proximité ni générer de comportements erratiques. Les approches à base de règles telles qu'ORCA ou DWA montrent leurs limites dans les environnements denses, tandis que les méthodes de deep RL conventionnelles reposent sur des distributions gaussiennes qui contraignent la variété des trajectoires produites. COLSON contourne cette limitation en exploitant les distributions d'actions plus riches offertes par les modèles de diffusion appliqués au RL, capables de représenter des comportements multimodaux (hésiter, contourner à gauche ou à droite) que les politiques gaussiennes tendent à lisser. L'apport central de la méthode est sa capacité de généralisation à des scénarios inédits sans ré-entraînement. Dans les démonstrations présentées, le robot adapte son comportement à des obstacles statiques absents du jeu d'entraînement, ou change d'objectif pour accompagner un piéton cible tout en évitant les autres passants. Pour les intégrateurs d'AMR en milieux hospitaliers, aéroportuaires ou logistiques, cette propriété de contrôlabilité zero-shot est stratégiquement importante : elle réduit le coût de re-paramétrage à chaque nouveau site de déploiement. Elle valide aussi partiellement l'hypothèse que les diffusion models peuvent atténuer le sim-to-real gap en navigation sociale, en générant des distributions d'actions plus robustes face à l'imprévu. Le champ de la social navigation par deep RL est actif depuis une décennie, avec des travaux fondateurs comme CADRL (2017), SARL et CrowdNav. L'application des modèles de diffusion au RL dans la robotique est plus récente, s'appuyant notamment sur Diffusion Policy (Columbia/MIT, 2023) dans le domaine de la manipulation. COLSON transfère cette logique vers la planification de mouvement en espace ouvert. Il s'agit à ce stade d'un preprint académique avec validation uniquement en simulation ; aucun déploiement sur robot réel ni partenariat industriel n'est mentionné, ce qui invite à tempérer les conclusions. Les éditeurs actifs sur la navigation sociale autonome incluent Boston Dynamics, ANYbotics et Clearpath Robotics, et côté européen Enchanted Tools (France) ou PAL Robotics (Espagne) pour les robots de service. Les prochaines étapes naturelles seraient une validation en environnement réel et un benchmarking sur les datasets standardisés ETH/UCY.

UELes intégrateurs AMR européens (dont Enchanted Tools en France, PAL Robotics en Espagne) pourraient à terme bénéficier de la contrôlabilité zero-shot de COLSON pour réduire les coûts de redéploiement multi-sites, mais la méthode reste validée uniquement en simulation sans partenariat industriel déclaré.

RecherchePaper
1 source
CLUE : indices contextuels à priorité adaptative et carte sémantique unifiée pour la navigation zero-shot vers des objets cibles
2arXiv cs.RO 

CLUE : indices contextuels à priorité adaptative et carte sémantique unifiée pour la navigation zero-shot vers des objets cibles

Des chercheurs ont publié sur arXiv (référence 2605.19206) un framework de navigation baptisé CLUE, conçu pour résoudre le problème de la navigation vers des objets cibles sans entraînement préalable sur ces objets, un défi connu sous le nom de zero-shot object-goal navigation (ZSON). L'idée centrale : un agent robotique doit localiser un objet donné dans un environnement inconnu en exploitant deux types d'indices contextuels, les pièces (un réfrigérateur se trouve presque toujours dans une cuisine) et les objets voisins co-localisés (des ciseaux peuvent se trouver partout, mais souvent près d'un bureau ou d'un plan de travail). CLUE extrait des connaissances de bon sens à partir d'un grand modèle de langage (LLM) utilisé hors ligne, calcule un score d'association entre la cible et les types de pièces, puis construit une carte sémantique unifiée pondérant dynamiquement ces deux sources d'information selon l'ambiguïté de la cible. Un mécanisme de vérification multi-points de vue complète le système. Les expériences menées en simulation et dans des environnements réels montrent que CLUE dépasse les baselines de l'état de l'art sur les métriques de taux de succès (SR) et de succès pondéré par la longueur du chemin (SPL), sans que des chiffres absolus ne soient communiqués dans l'abstract. L'intérêt pratique de cette approche tient à une critique implicite des méthodes existantes : traiter tous les indices contextuels avec le même poids conduit à une exploration inefficace. Pour un intégrateur de robots de service, cela signifie des trajectoires plus courtes et une meilleure résilience dans des environnements non cartographiés, comme les hôpitaux, les entrepôts ou les environnements domestiques. L'utilisation d'un LLM hors ligne, plutôt qu'en inférence temps réel, réduit la latence et les dépendances cloud, un avantage concret pour le déploiement industriel. La démonstration en environnement réel, même si ses conditions exactes ne sont pas précisées, distingue CLUE de nombreux travaux restés en simulation pure. Ce travail s'inscrit dans un champ de recherche actif sur la navigation sémantique, aux côtés de méthodes comme ESC, VLFM ou SemEXP, issues principalement de laboratoires américains (CMU, Georgia Tech, Berkeley). CLUE se positionne comme une couche d'arbitrage contextuel au-dessus de ces approches plutôt que comme une refonte complète de l'architecture. Le papier est une prépublication arXiv, non encore évalué par les pairs, ce qui invite à la prudence sur la généralisabilité des résultats. Aucune affiliation industrielle ni plateforme matérielle spécifique n'est mentionnée. Les prochaines étapes naturelles seraient une validation sur des robots commerciaux (AMR de type Boston Dynamics Spot, Hello Robot Stretch ou plateformes mobiles ROS2-compatibles) et une comparaison sur les benchmarks standardisés HM3D ou Gibson.

RecherchePaper
1 source
Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace
3arXiv cs.RO 

Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace

Une équipe de chercheurs propose, dans un préprint déposé sur arXiv le 2 mai 2026 (référence 2605.02192), un nouveau cadre d'entraînement pour la navigation robotique par apprentissage par renforcement profond (DRL), baptisé Multi-Collision reset Budget (MCB). La convention actuelle dans la majorité des frameworks DRL est la suivante : toute collision déclenche immédiatement un reset global de l'épisode et est comptabilisée comme un échec total de la tâche. MCB rompt avec cette logique en découplant la terminaison locale sur collision du reset global de l'environnement, permettant à l'agent d'effectuer plusieurs tentatives au sein d'un même épisode sur une configuration d'obstacles difficile, jusqu'à épuisement d'un budget de collisions défini. Les expériences ont été conduites sur plusieurs plateformes robotiques simulées et réelles, et les auteurs rapportent des gains de taux de succès et d'efficacité de navigation supérieurs aux baselines à collision unique, avec un budget de collisions réduit produisant les meilleurs résultats. L'enjeu est directement lié à une limite connue du DRL appliqué à la navigation en environnements denses : en pénalisant durement chaque collision dès les premières étapes d'entraînement, les agents évitent les configurations complexes plutôt que de les apprendre, ce qui ralentit la convergence. MCB autorise une exploration plus agressive des zones difficiles sans pour autant sacrifier la sécurité en déploiement, où la politique apprise conserve un comportement zéro-collision. Cela adresse indirectement le "sim-to-real gap" en exposant l'agent à des scénarios d'entassement d'obstacles que les resets prématurés rendaient statistiquement rares durant la phase d'exploration précoce. L'approche n'est toutefois présentée que dans un contexte de résultats expérimentaux préliminaires, sans benchmark comparatif exhaustif sur des datasets standardisés. Cette publication s'inscrit dans un débat plus large sur la conception des fonctions de récompense et des conditions de terminaison en DRL pour la navigation mobile, un domaine où des travaux comme ceux de Berkeley (sur la navigation sociale) ou les approches curriculum learning d'OpenAI ont montré l'importance des dynamiques d'exploration en début d'entraînement. Côté robotique industrielle, les AMR (Autonomous Mobile Robots) de Exotec ou des intégrateurs logistiques européens utilisent majoritairement des planificateurs classiques, mais la pression vers des politiques apprises pour des environnements non-structurés rend ce type de recherche pertinent à moyen terme. La prochaine étape logique serait une validation sur des plateformes de référence (TurtleBot, Spot, ou robots humanoïdes à roues) et une comparaison directe avec des méthodes curriculum existantes.

UEImpact indirect à moyen terme : si l'approche MCB se confirme sur des benchmarks standardisés, des acteurs comme Exotec ou des intégrateurs AMR européens opérant en environnements non-structurés pourraient en tirer parti pour passer à des politiques de navigation apprises.

RecherchePaper
1 source
Modèle du monde pour la navigation sociale de robots guidée par la logique
4arXiv cs.RO 

Modèle du monde pour la navigation sociale de robots guidée par la logique

Des chercheurs ont publié NaviWM (Navigation World Model), un système de navigation robotique socialement consciente qui couple un grand modèle de langage (LLM) avec un modèle de monde structuré et un module de raisonnement logique déductif. Le système repose sur deux composants principaux : un modèle spatio-temporel qui capture en temps réel les positions, vitesses et activités des agents présents dans l'environnement, et un module de raisonnement par chaîne-de-pensée (chain-of-thought) guidé par des règles formelles. La nouveauté centrale est l'encodage des normes sociales en logique du premier ordre (first-order logic), ce qui rend le raisonnement du robot vérifiable et interprétable, contrairement aux approches par prompt engineering ou fine-tuning. Les expériences menées montrent une amélioration du taux de succès de navigation et une réduction des violations sociales dans les environnements encombrés. L'article, disponible en version 2 sur arXiv (référence 2510.23509), est accompagné de vidéos de démonstration publiées par les auteurs. Ce travail s'attaque à une faille bien documentée des LLM appliqués à la planification de trajectoires en robotique mobile : le manque d'ancrage physique et de cohérence logique lorsqu'ils opèrent seuls. En environnements dynamiques peuplés d'humains, les LLM purs produisent des comportements imprévisibles, voire dangereux. En ajoutant une couche de raisonnement formel en aval du LLM sous des contraintes explicites (espace personnel, évitement de collision, gestion du timing), NaviWM propose une solution plus robuste. Pour un intégrateur travaillant sur des robots de service en intérieur, livraison hospitalière ou navigation en entrepôt mixte humain-robot, cela représente un levier concret pour réduire le gap entre démonstration en laboratoire et déploiement opérationnel. Le caractère interprétable du raisonnement constitue également un atout pour les exigences de traçabilité et de certification en milieu industriel ou médical. La navigation sociale pour robots mobiles est un champ en forte effervescence, où coexistent des approches classiques comme ORCA (Optimal Reciprocal Collision Avoidance), des prédicteurs à base de réseaux LSTM sociaux, et plus récemment des systèmes intégrant des VLA (Vision-Language-Action models) comme Pi-0 ou les architectures embarquées de Boston Dynamics et Figure. NaviWM se positionne dans un segment distinct : il ne cherche pas à remplacer le LLM mais à le contraindre via un modèle du monde explicite et des règles formelles, une approche hybride neuro-symbolique proche des travaux du MIT CSAIL sur la planification task-and-motion. Les prochaines étapes naturelles seront de valider l'architecture sur des plateformes physiques hors simulation et de tester la robustesse des règles logiques face à des scénarios sociaux non anticipés lors de leur encodage initial.

RecherchePaper
1 source