Aller au contenu principal
SCAN-Planner : planification locale anticollision pour la navigation guidée longue portée de quadrupèdes
RecherchearXiv cs.RO2h

SCAN-Planner : planification locale anticollision pour la navigation guidée longue portée de quadrupèdes

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2606.19555) une lettre décrivant SCAN-Planner, un cadre de planification locale pour robots quadrupèdes destiné à la navigation longue portée en environnements non structurés. Le système s'attaque à trois familles de situations problématiques : les passages étroits, les scènes intérieures encombrées et les terrains 3D complexes à grande échelle. L'innovation centrale est un empreinte bicylindrique sensible au lacet (yaw-aware twin-cylinder footprint) qui modélise le corps allongé du quadrupède, par opposition aux approximations isotropiques classiques qui gonflent le robot comme une sphère ou un cylindre unique. Cette représentation permet une évaluation des collisions sur l'ensemble du corps via des requêtes éparses dans une carte d'occupation 3D gonflée. Le système intègre également une recherche A* projetée sur une surface d'adhérence au sol interpolée, avec suppression de gradient vertical pour contourner les obstacles horizontaux sans compromettre la stabilité verticale. Pour le déploiement à grande échelle, une carte glissante centrée sur le robot avec mécanisme de repli aux frontières assure un contrôle de collision local haute résolution et une récupération des impasses locales. Les expériences combinent simulation et terrain réel : couloirs encombrés, scènes 3D non structurées, franchissement d'escaliers et navigation longue portée.

L'intérêt pour les intégrateurs et les équipes robotiques tient à deux points concrets. D'abord, la prise en compte explicite des surplombs et structures tridimensionnelles comble une lacune réelle des planificateurs à carte d'élévation 2.5D, qui échouent dès qu'un obstacle dépasse un plan horizontal unique. Ensuite, le mécanisme de carte glissante adresse le passage à l'échelle (large-scale deployment) sans exploser les besoins mémoire, un problème récurrent dans les déploiements industriels longue distance. L'approche valide aussi empiriquement que la modélisation fine du corps du robot améliore la navigation en espace contraint, là où les planificateurs conservateurs dilatent excessivement les marges de sécurité et bloquent le robot dans des passages praticables.

Côté contexte, la planification locale pour quadrupèdes est un terrain dense : les plateformes Boston Dynamics Spot et ANYbotics ANYmal ont popularisé ces robots hors laboratoire, mais leurs planificateurs embarqués restent majoritairement propriétaires. Côté académique, les travaux récents s'appuient sur des représentations comme les cartes de distance euclidienne (ESDF) ou les réseaux de perception, avec des systèmes comme le locomotion controller de ANYmal-D ou les frameworks de navigation de l'ETH Zurich. SCAN-Planner se positionne comme une couche de planification locale agnostique au locomotion controller, compatible avec un guidage de route externe. Aucun déploiement industriel ni partenariat commercial n'est mentionné dans la publication actuelle, qui reste une contribution de recherche en cours d'évaluation par les pairs.

À lire aussi

Évaluation d'une colonne vertébrale actionnée pour la locomotion agile de quadrupèdes
1arXiv cs.RO 

Évaluation d'une colonne vertébrale actionnée pour la locomotion agile de quadrupèdes

Une équipe de chercheurs a publié sur arXiv (preprint 2605.07988) une étude empirique évaluant les bénéfices d'une colonne vertébrale motorisée pour la locomotion agile de robots quadrupèdes. Les expériences ont été conduites en simulation MuJoCo sur le Silver Badger de MAB Robotics, startup polonaise spécialisée dans les robots à pattes. La colonne vertébrale testée dispose d'un seul degré de liberté (1-DOF) dans le plan sagittal, permettant flexion et extension verticale du tronc. Cinq scénarios ont été évalués : course à haute vitesse, montée de marches, franchissement de pentes à fort angle, saut d'obstacles et progression dans des passages étroits. Les résultats indiquent que le robot équipé du spine motorisé franchit des marches plus hautes, des pentes plus raides, des obstacles plus élevés et des passages plus étroits que sa version à tronc rigide, sans que des métriques précises (angles, hauteurs, vitesses) soient communiquées dans le résumé. Ces résultats confirment empiriquement un principe observé chez les animaux mais peu exploré en robotique commerciale : la mobilité du tronc étend les capacités locomotrices sans nécessiter une refonte architecturale majeure. Pour les intégrateurs et développeurs de plateformes mobiles, l'ajout d'un seul actionneur sur le tronc pourrait élargir le domaine d'opérabilité dans des environnements complexes, entrepôts, chantiers ou milieux semi-naturels. La limite majeure reste le cadre purement simulé de l'étude : les gains rapportés n'ont pas été validés sur matériel réel, et le sim-to-real gap constitue un obstacle classique pour ce type de modification mécanique, notamment en ce qui concerne les dynamiques de contact sol/pattes. La question du spine flexible en quadrupédie robotique n'est pas nouvelle, les études sur les félins et guépards ayant démontré que la flexion du tronc allonge l'enjambée et améliore l'efficacité énergétique. En pratique, des plateformes comme ANYmal d'ANYbotics (Suisse) ou Spot de Boston Dynamics ont opté pour des troncs rigides, privilégiant la simplicité de contrôle et la robustesse mécanique. MAB Robotics, entreprise polonaise de l'écosystème UE, positionne le Silver Badger comme plateforme de recherche ouverte à ce type d'expérimentation. Les suites logiques incluent une validation sur robot physique, un spine multi-DOF, et une mesure de l'impact sur la consommation énergétique, paramètre absent de l'étude actuelle.

UEMAB Robotics (Pologne, UE) fournit la plateforme Silver Badger pour cette étude, confirmant son rôle de vecteur de recherche ouverte dans l'écosystème robotique européen des quadrupèdes, aux côtés d'ANYbotics (Suisse).

RecherchePaper
1 source
Modèle du monde pour la navigation sociale de robots guidée par la logique
2arXiv cs.RO 

Modèle du monde pour la navigation sociale de robots guidée par la logique

Des chercheurs ont publié NaviWM (Navigation World Model), un système de navigation robotique socialement consciente qui couple un grand modèle de langage (LLM) avec un modèle de monde structuré et un module de raisonnement logique déductif. Le système repose sur deux composants principaux : un modèle spatio-temporel qui capture en temps réel les positions, vitesses et activités des agents présents dans l'environnement, et un module de raisonnement par chaîne-de-pensée (chain-of-thought) guidé par des règles formelles. La nouveauté centrale est l'encodage des normes sociales en logique du premier ordre (first-order logic), ce qui rend le raisonnement du robot vérifiable et interprétable, contrairement aux approches par prompt engineering ou fine-tuning. Les expériences menées montrent une amélioration du taux de succès de navigation et une réduction des violations sociales dans les environnements encombrés. L'article, disponible en version 2 sur arXiv (référence 2510.23509), est accompagné de vidéos de démonstration publiées par les auteurs. Ce travail s'attaque à une faille bien documentée des LLM appliqués à la planification de trajectoires en robotique mobile : le manque d'ancrage physique et de cohérence logique lorsqu'ils opèrent seuls. En environnements dynamiques peuplés d'humains, les LLM purs produisent des comportements imprévisibles, voire dangereux. En ajoutant une couche de raisonnement formel en aval du LLM sous des contraintes explicites (espace personnel, évitement de collision, gestion du timing), NaviWM propose une solution plus robuste. Pour un intégrateur travaillant sur des robots de service en intérieur, livraison hospitalière ou navigation en entrepôt mixte humain-robot, cela représente un levier concret pour réduire le gap entre démonstration en laboratoire et déploiement opérationnel. Le caractère interprétable du raisonnement constitue également un atout pour les exigences de traçabilité et de certification en milieu industriel ou médical. La navigation sociale pour robots mobiles est un champ en forte effervescence, où coexistent des approches classiques comme ORCA (Optimal Reciprocal Collision Avoidance), des prédicteurs à base de réseaux LSTM sociaux, et plus récemment des systèmes intégrant des VLA (Vision-Language-Action models) comme Pi-0 ou les architectures embarquées de Boston Dynamics et Figure. NaviWM se positionne dans un segment distinct : il ne cherche pas à remplacer le LLM mais à le contraindre via un modèle du monde explicite et des règles formelles, une approche hybride neuro-symbolique proche des travaux du MIT CSAIL sur la planification task-and-motion. Les prochaines étapes naturelles seront de valider l'architecture sur des plateformes physiques hors simulation et de tester la robustesse des règles logiques face à des scénarios sociaux non anticipés lors de leur encodage initial.

RecherchePaper
1 source
AgniNav : planification locale multi-plateforme pilotée par configuration pour la navigation robotique
3arXiv cs.RO 

AgniNav : planification locale multi-plateforme pilotée par configuration pour la navigation robotique

Une équipe de recherche a publié en juin 2026 sur arXiv (référence 2606.10903) un framework de navigation locale appelé AgniNav, conçu pour permettre à des robots de morphologies radicalement différentes de naviguer en autonomie à partir d'une unique caméra RGB, sans recourir à un capteur de profondeur actif et sans réentraînement du modèle. Le système repose sur une enveloppe de sécurité définie par quatre paramètres mesurables : hauteur critique pour la détection de collisions, longueur avant, longueur arrière, demi-largeur. Ces paramètres conditionnent simultanément un réseau image-vers-scan qui prédit un pseudo-laserscan 1D à partir d'une image couleur monoculaire, et un planificateur local qui adapte la vérification de collisions au gabarit du robot. Les expérimentations ont été conduites sur trois plateformes réelles : le Turtlebot2 (base à roues), l'Unitree Go2 (quadrupède), et l'Accelerated Evolution K1 (humanoïde). Les taux de succès sont respectivement de 39/40, 18/20 et 18/20, avec 0, 1 et 2 collisions sur l'ensemble des essais, le tout tournant à 30 Hz sur un Jetson Orin. Ce qui distingue AgniNav des travaux existants est précisément l'absence de retraining par plateforme. La quasi-totalité des politiques de navigation visuelle actuelles sont entraînées pour un couple caméra/gabarit fixe, ce qui rend leur transfert d'un robot à un autre coûteux en données et en temps. Ici, le même réseau, entraîné une fois sur des paires couleur-profondeur supervisées par des labels de scan générés à la volée, se déploie sans adaptation sur des morphologies aussi différentes qu'un rover plat et un humanoïde. Pour un intégrateur gérant une flotte hétérogène, ou pour un OEM souhaitant embarquer la navigation sur plusieurs SKUs avec un seul modèle, c'est un changement d'économie non négligeable. La navigation cross-embodiment est un problème ouvert depuis plusieurs années dans la communauté robotique : les approches concurrentes, comme celles mobilisant des politiques VLA (vision-language-action) ou des pipelines basés sur la simulation, exigent généralement soit du matériel dédié (LiDAR, caméra de profondeur RGB-D), soit des cycles de fine-tuning par plateforme. AgniNav s'inscrit dans un courant de travaux cherchant à normaliser la couche de perception au niveau de l'enveloppe physique plutôt que du modèle de robot complet. Le résultat présenté reste à ce stade une contribution de recherche, pas un produit ou un SDK distribué. Les prochaines étapes naturelles incluent la validation sur des environnements dynamiques et des densités d'obstacles plus élevées, ainsi que l'extension à des architectures d'enveloppe plus complexes pour les humanoïdes à forte variation de posture.

RecherchePaper
1 source
SemGeoNav : une approche de navigation visuelle guidée par la sécurité, combinant raisonnement sémantique et planification géométrique
4arXiv cs.RO 

SemGeoNav : une approche de navigation visuelle guidée par la sécurité, combinant raisonnement sémantique et planification géométrique

Des chercheurs ont proposé SemGeoNav, un framework de navigation visuelle hiérarchique publié sur arXiv en juin 2026 (arXiv:2606.16400), conçu pour les robots devant atteindre des cibles définies par des images dans des environnements ouverts. L'architecture combine deux couches distinctes : un module de raisonnement sémantique de haut niveau issu des modèles apprenants end-to-end, et un planificateur géométrique local responsable de la sécurité immédiate. Un mécanisme de lissage temporel de trajectoire vient compléter l'ensemble pour garantir des déplacements continus et stables. Les expériences ont été menées sur un robot quadrupède Unitree Go2 dans des environnements réels, et les résultats indiquent des taux de succès supérieurs ainsi que des temps de navigation plus courts que deux baselines de référence du domaine, ViNT et NoMaD. L'apport principal de SemGeoNav réside dans le traitement d'une tension structurelle bien documentée en robotique autonome : les modèles end-to-end apprenants, en particulier les architectures de type VLA (Vision-Language-Action), excellent dans la compréhension sémantique de haut niveau mais manquent de contraintes géométriques explicites, ce qui génère des comportements imprévisibles face aux obstacles en environnement non structuré. À l'inverse, les planificateurs géométriques classiques (champ de potentiel, DWA) garantissent la sécurité locale mais peinent à interpréter des cibles visuelles haute dimension. L'approche hybride hiérarchique de SemGeoNav apporte une réponse architecturale à ce problème de fiabilité opérationnelle, avec des implications directes pour les intégrateurs déployant des robots mobiles en entrepôt ou en environnement industriel non balisé. ViNT et NoMaD, tous deux issus du Berkeley AI Research Lab, constituent les références dominantes en navigation visuelle généraliste à cible imageante. SemGeoNav se positionne explicitement contre ces deux modèles en revendiquant de meilleures performances terrain. Il s'inscrit dans un courant plus large qui remet en question les architectures purement end-to-end au profit de systèmes hybrides modulaires, une direction également explorée par plusieurs équipes européennes et asiatiques. Ce preprint ne publie pas de métriques standardisées comme le SPL (Success weighted by Path Length) ou les benchmarks HM3D/MP3D, ce qui rend difficile toute comparaison directe avec l'état de l'art; une validation à plus grande échelle et sur des jeux de données partagés constituerait la prochaine étape crédible pour ce travail.

RecherchePaper
1 source