G-DRAGON : raisonnement géospatial et planification dynamique pour la navigation extérieure augmentée par récupération
G-DRAGON (Geospatial Reasoning and Dynamic Planning for Retrieval-Augmented Outdoor Navigation) est un framework de navigation présenté dans un preprint arXiv (mai 2026) pour robots terrestres autonomes en extérieur à grande échelle. Le système associe un LLM léger exécuté localement à OpenStreetMap pour convertir des instructions en langage naturel en coordonnées géospatiales précises, servant à la planification de routes topologiques. Un module de haut niveau relie ces itinéraires au SLAM embarqué du robot, tandis qu'en fin de parcours G-DRAGON bascule vers une exploration à base de frontières couplée à une cartographie sémantique voxel en vocabulaire ouvert, pour localiser des cibles décrites librement. En simulation, le système surpasse les baselines de l'état de l'art. Sur un UGV réel en milieu urbain non préparé, il a complété des missions de recherche de personnes avec des trajectoires atteignant 500 mètres.
Ce travail comble un angle mort structurel des approches VLN (Visual-Language Navigation) actuelles, efficaces à courte portée mais dépourvues d'ancrage géospatial pour des missions longue distance. Les méthodes OSM couplées à des LLMs cloud pallient partiellement ce déficit, mais souffrent d'hallucinations factuelles et d'une incapacité à gérer le "dernier kilomètre" en vocabulaire ouvert. En substituant un modèle local et léger, G-DRAGON réduit la dépendance aux API distantes et améliore la fiabilité terrain, une propriété critique pour l'inspection industrielle, la livraison autonome ou les missions de sécurité. La validation en environnement urbain réel, même limitée à 500m et à un seul type de mission, distingue ce travail de la majorité des publications cantonnées à la simulation.
G-DRAGON s'inscrit dans une trajectoire de recherche ouverte par NavGPT, LM-Nav et ViNT, qui ont progressivement intégré les LLMs dans la planification de trajectoires robots. La substitution d'un modèle edge à un LLM cloud s'aligne sur une tendance plus large d'inférence locale dans la robotique de service et industrielle. Les concurrents directs sont les frameworks académiques de navigation guidée par le langage ainsi que les pipelines LLM multimodaux couplés à des robots commerciaux. Aucun acteur européen n'est cité dans le papier, bien que des laboratoires comme le LAAS-CNRS travaillent sur des problématiques adjacentes de navigation autonome en environnements complexes. Le papier n'étant pas encore soumis à une relecture par les pairs, les métriques de performance en simulation restent à confirmer sur des environnements plus diversifiés et des missions multi-étapes.
Le LAAS-CNRS travaille sur des problématiques adjacentes de navigation autonome en environnements complexes, et la tendance à l'inférence locale illustrée par G-DRAGON est directement pertinente pour les équipes R&D robotique françaises et européennes cherchant à réduire leur dépendance aux API cloud.
Dans nos dossiers




