Aller au contenu principal
RecherchearXiv cs.RO2h

SPADE : planification de trajectoires guidée par croquis et augmentée par des experts en diffusion

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié sur arXiv (référence 2506.03512) un framework baptisé SPADE, pour Sketch-guided Path Planning Augmented with Diffusion Experts, destiné à améliorer la planification de trajectoires pour les robots mobiles autonomes (AMR). Le système repose sur deux contributions distinctes : un outil d'annotation repensé de zéro sur ROS 2, permettant une collecte de démonstrations expertes plus robuste, et une stratégie d'entraînement inédite qui intègre une augmentation par diffusion dans des modèles de clonage comportemental (behavioral cloning). Sur les métriques publiées, SPADE affiche une erreur de pose absolue (APE) inférieure de 39,1 % et une distance FID (Fréchet Inception Distance) réduite de 33,5 % par rapport aux méthodes de référence, avec 93,8 % de paramètres entraînables en moins.

Ce résultat est notable parce qu'il attaque un compromis longtemps considéré comme structurel dans le domaine : les modèles de diffusion généralisent bien à des environnements non vus mais sont trop lents pour un déploiement embarqué en temps réel, tandis que les modèles de clonage comportemental légers s'exécutent rapidement mais peinent à sortir de leur distribution d'entraînement. SPADE prétend combiner les deux propriétés sans sacrifier l'une pour l'autre, ce qui, si confirmé sur des benchmarks tiers, représenterait un levier direct pour les intégrateurs d'AMR en logistique et en industrie manufacturière. La réduction drastique du nombre de paramètres ouvre également la voie à un déploiement sur du matériel embarqué contraint.

Les approches actuelles de planification avec préférences humaines s'appuient typiquement soit sur du reward engineering manuel, soit sur des solutions matérielles lourdes. Le clonage comportemental via imitation learning a émergé récemment comme alternative, avec des travaux de référence que SPADE cite sans les nommer dans l'abstract. L'outil d'annotation basé sur ROS 2 adresse spécifiquement le problème de la qualité des démonstrations, souvent le maillon faible des pipelines d'imitation learning. Il s'agit pour l'instant d'un preprint sans évaluation indépendante publiée ; les ablations présentées dans l'article restent auto-évaluées par les auteurs, ce qui impose une lecture critique avant toute intégration dans un pipeline de production.

Dans nos dossiers

À lire aussi

SPARC : planification de trajectoire spatiale par communication robotique attentive
1arXiv cs.RO 

SPARC : planification de trajectoire spatiale par communication robotique attentive

Une équipe de chercheurs a publié sur arXiv (référence 2603.02845v3) SPARC, un système de planification de trajectoires pour flottes de robots autonomes décentralisées, centré sur un nouveau mécanisme de communication baptisé RMHA (Relation enhanced Multi Head Attention). Le constat de départ est précis : dans les approches d'apprentissage multi-agents existantes, chaque robot traite les messages de ses voisins de manière uniforme, sans tenir compte de leur distance réelle. En environnement dense, cette indifférence spatiale dilue l'attention là où la coordination est justement la plus critique. RMHA intègre directement les distances de Manhattan par paires dans le calcul des poids d'attention, permettant à chaque robot de prioriser dynamiquement les messages des voisins les plus proches. Ce mécanisme est couplé à un masque d'attention contraint par distance et à une fusion de messages par réseau GRU (Gated Recurrent Unit), le tout entraîné en bout en bout via MAPPO, un algorithme d'apprentissage par renforcement multi-agents. Sur des grilles de 40x40 cases avec 30 % de densité d'obstacles, SPARC atteint environ 75 % de taux de succès, surpassant la meilleure méthode de référence de plus de 25 points de pourcentage. Le résultat le plus structurant est la généralisation zéro-shot : le système est entraîné sur des scénarios à 8 robots et testé directement sur des configurations à 128 robots, sans ré-entraînement. Cette capacité de mise à l'échelle sans supervision supplémentaire est un verrou majeur pour les déploiements industriels réels, notamment en logistique entrepôt où les flottes AMR peuvent dépasser plusieurs dizaines d'unités. Les ablations confirment que l'encodage de la relation de distance est le facteur déterminant du gain de performance en haute densité, ce qui valide l'hypothèse que le biais spatial manquait aux architectures à attention standard appliquées à la coordination robotique. MRPP est un champ de recherche actif depuis une décennie, avec des approches classiques comme CBS (Conflict-Based Search) et des variantes apprises reposant sur QPLEX, MAPPO ou des graph neural networks. SPARC s'inscrit dans la lignée des travaux combinant attention multi-têtes et apprentissage multi-agents coopératif, en corrigeant un angle mort de conception commun à la majorité de ces systèmes. Il n'y a pas, à ce stade, de déploiement annoncé ni de partenariat industriel mentionné : il s'agit d'une contribution de recherche académique. Les prochaines étapes attendues dans ce domaine incluent la validation sur environnements physiques réels et l'extension à des grilles de plus grande dimension, deux conditions nécessaires avant toute intégration dans des systèmes AMR commerciaux.

RecherchePaper
1 source
Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents
2arXiv cs.RO 

Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents

Une équipe de chercheurs propose, dans un préprint arXiv (2606.00933) publié début juin 2026, un cadre de planification de trajectoires pour flottes de robots mobiles combinant modèles de diffusion génératifs et apprentissage par renforcement multi-agents (MARL). Concrètement, chaque robot génère indépendamment des trajectoires candidates via un modèle de diffusion entraîné sur des données mono-agent, puis une fonction de valeur centralisée, apprise par MARL, oriente le processus de débruitage par gradient pour réduire les conflits entre agents. Ce mécanisme dit d'"exponential tilting" pousse la distribution de débruitage vers les trajectoires associées au meilleur retour collectif attendu. Évalué en simulation sur un labyrinthe avec quatre robots mobiles, le système réduit le taux d'interférence inter-agents de 55,4 % à 41,8 %, sans nécessiter de ré-entraînement du modèle génératif ni de planification jointe centralisée. Ce résultat attaque directement le compromis historique entre planification centralisée (précise mais peu scalable à mesure que la flotte grossit) et planification décentralisée (scalable mais aveugle aux autres agents). Le fait que la coordination soit injectée via un signal de guidage externe sans modifier le planificateur diffusion de base ouvre la voie à des architectures modulaires : on entraîne une fois le modèle de trajectoire mono-agent, puis on greffe la coordination selon l'environnement de déploiement. Pour les intégrateurs de systèmes multi-robots en entrepôt ou en manufacture, cela suggère qu'un découplage entre planification locale et coordination globale est techniquement praticable, ce qui simplifierait la mise à l'échelle des flottes hétérogènes sans refonte complète du pipeline. Le domaine est depuis longtemps dominé par des méthodes à base de graphes comme CBS (Conflict-Based Search) ou des approches réactives décentralisées comme ORCA, avec des tentatives d'apprentissage profond restées limitées en conditions réelles. L'application des modèles de diffusion à la génération de trajectoires robotiques constitue un courant émergent, illustré notamment par Diffusion Policy (Chi et al., 2023) en manipulation, mais rarement couplé au MARL pour la coordination de flotte. Ce travail reste pour l'instant une preuve de concept en simulation sur quatre robots dans un environnement simple, et la généralisation à des scènes dynamiques, à des flottes plus larges ou à des robots hétérogènes demeure un défi non adressé. Les prochaines étapes naturelles incluent la validation sur hardware réel et la confrontation aux benchmarks de référence du MAPF (Multi-Agent Path Finding).

RecherchePaper
1 source
Parallel OctoMapping : un cadre évolutif pour la planification de trajectoires en navigation autonome
3arXiv cs.RO 

Parallel OctoMapping : un cadre évolutif pour la planification de trajectoires en navigation autonome

Une équipe de chercheurs a publié sur arXiv (référence 2603.22508v2, mis à jour en mai 2026) une méthode de cartographie baptisée Parallel OctoMapping (POMP), destinée à améliorer la planification de trajectoires dans les systèmes de navigation autonome. POMP s'appuie sur le framework OctoMap, une représentation volumétrique de l'espace libre et occupé largement utilisée en robotique mobile. La contribution centrale consiste à raffiner la représentation de l'espace libre à résolution de grille d'occupancy fixe, tout en préservant la fidélité de la carte et en exploitant le calcul multi-thread. Les auteurs soutiennent, sous réserve de vérification indépendante, qu'il s'agirait de la première méthode à combiner ces deux propriétés à résolution constante. L'enjeu pratique concerne directement les intégrateurs de robots mobiles et les déploiements AMR (Autonomous Mobile Robots) en environnements encombrés. Les méthodes classiques à résolution fixe produisent des représentations d'obstacles trop conservatives, ce qui génère soit des trajectoires sous-optimales, soit des échecs de planification dans des espaces denses. POMP prétend améliorer simultanément le taux de succès de la planification et la longueur des chemins calculés, tout en réduisant substantiellement le coût computationnel grâce au parallélisme. Si ces gains se confirment sur des benchmarks indépendants, la méthode pourrait s'insérer dans des pipelines existants utilisant des planificateurs A* ou équivalents, sans refonte architecturale majeure. OctoMap est un standard de facto dans la navigation robotique depuis les travaux d'Hornung et al. (2013), massivement adopté dans ROS et ROS2 pour les drones, véhicules autonomes et robots d'entrepôt. POMP se positionne comme une extension drop-in plutôt qu'un remplacement, ce qui réduit la barrière à l'adoption. Sur le plan académique, la cartographie haute performance mobilise également des approches concurrentes comme VDB-EDF (NVIDIA), les représentations neurales implicites de type NeRF-Nav, ou les grilles probabilistes hiérarchiques. À ce stade, POMP reste un preprint non évalué par les pairs, sans implémentation open source ni benchmark standardisé publiquement référencé dans l'abstract disponible.

RecherchePaper
1 source
LiftNav : planification de trajectoire par élévation sémantique dans un Gaussian Splatting guidé par TSDF
4arXiv cs.RO 

LiftNav : planification de trajectoire par élévation sémantique dans un Gaussian Splatting guidé par TSDF

Une équipe de chercheurs a publié LiftNav sur arXiv (référence 2605.31376), un système de planification de trajectoires pour robots autonomes en environnements intérieurs inconnus. Le système repose sur une carte duale combinant TSDF (Truncated Signed Distance Function, représentation géométrique précise pour l'évitement d'obstacles) et Gaussian Splatting (GS, méthode de rendu à base de primitives gaussiennes 3D), en s'appuyant sur l'architecture GSFusion comme fondation. À cette base hybride s'ajoutent, en temps réel, une détection d'objets par YOLO, un mécanisme de "lifting" 3D ancré dans le TSDF pour projeter les détections sémantiques dans l'espace volumique, et une optimisation de trajectoire par splines B. Pour améliorer fluidité et sécurité, les auteurs introduisent une pénalité de collision basée sur la hinge loss. Évalué en simulation sur le dataset Replica (environnements intérieurs synthétiques de haute fidélité de Meta), LiftNav atteint un taux de faisabilité de 100% et génère des trajectoires plus courtes qu'un système de référence basé sur les champs de radiance neuraux. Ce résultat s'attaque à un compromis fondamental de la navigation robotique : les représentations classiques comme le TSDF garantissent la sécurité géométrique mais sont aveugles sémantiquement, tandis que les méthodes photorréalistes de type Gaussian Splatting offrent une compréhension visuelle riche mais présentent des géométries floues peu fiables pour l'évitement de collision. LiftNav propose de réconcilier les deux sans recourir à des embeddings 3D denses, souvent coûteux en mémoire et en calcul, ce qui constitue l'argument différenciant central. Pour les intégrateurs robotique, c'est une architecture susceptible de réduire la complexité de déploiement de robots de service dans des espaces non structurés. Il convient toutefois de souligner que ces performances sont mesurées exclusivement en simulation, sans aucune validation sur robot physique rapportée dans cette publication. LiftNav s'inscrit dans une dynamique de recherche active autour de la navigation sémantique : des travaux comme ConceptFusion ou LERF intègrent des embeddings de type CLIP dans des NeRF ou des GS, mais au prix d'une empreinte computationnelle élevée. L'approche par lifting TSDF retenue ici est plus légère, au potentiel détriment d'une richesse sémantique fine. Les concurrents directs incluent les pipelines combinant SLAM 3D avec des couches de détection dense comme Mask3D, ainsi que les systèmes NeRF-Nav. La prochaine étape naturelle serait une validation sur plateforme physique pour quantifier le gap sim-to-real, point clé que les auteurs ne mentionnent pas dans cet abstract.

RecherchePaper
1 source