Aller au contenu principal
EXACT-MPPI : navigation par distance signée pour robots à empreinte arbitraire depuis des nuages de points
RecherchearXiv cs.RO20h

EXACT-MPPI : navigation par distance signée pour robots à empreinte arbitraire depuis des nuages de points

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (preprint 2605.29663) EXACT-MPPI, un framework de navigation locale sans entraînement pour robots au sol dont l'empreinte est non-convexe en raison de charges utiles, d'accessoires ou d'outils fixés à la plateforme. Le système cartographie directement des observations en nuage de points locaux vers des commandes de mouvement, sans grille d'occupation ni champ de distances intermédiaire. Son cœur est un évaluateur analytique de distance signée exacte, intégré dans un contrôleur MPPI (Model Predictive Path Integral) : l'empreinte du robot est décrite comme un polygone simple, convexe ou concave, avec une spécialisation rectangulaire pour les formes rectilinéaires. À chaque itération MPPI, les points d'obstacles observés sont transformés dans le repère du corps prédit et évalués contre ce polygone. Toutes les opérations sont vectorisées sous JAX pour exploiter le parallélisme GPU en temps réel.

L'apport principal est l'élimination des approximations qui réduisent les trajectoires faisables : les planificateurs locaux courants simplifient l'empreinte par une enveloppe convexe ou l'inflatent, ce qui supprime des mouvements valides lorsque la clearance est comparable à la géométrie réelle. Les expériences montrent qu'EXACT-MPPI accélère l'évaluation des distances par lot par rapport aux baselines apprises de type point-à-robot, préserve des mouvements que les planificateurs à empreinte convexe refusent, et reste robuste face à des obstacles statiques et mobiles denses. Aucun entraînement, décomposition convexe, inflation ni encodeur appris n'est requis, ce qui simplifie considérablement le déploiement.

Ce travail répond à un défi persistant dans les AMR industriels et agricoles : les robots réels portent des fourches, bras ou outils qui rendent l'empreinte irrégulière, mais la majorité des stacks de navigation supposent une géométrie simplifiée. EXACT-MPPI se déploie sur des plateformes à entraînement différentiel, Ackermann, omnidirectionnelles et hybrides en changeant uniquement la description de l'empreinte et le modèle de mouvement, sans réentraînement. Face aux approches neuronales concurrentes qui nécessitent des jeux de données spécifiques à chaque configuration, cet évaluateur analytique est plus facilement auditable et intégrable dans un pipeline industriel existant. La principale contrainte reste la dépendance à un accélérateur GPU pour le contrôle temps réel, un frein non négligeable pour les plateformes embarquées contraintes en énergie.

Dans nos dossiers

À lire aussi

Navigating l'encombrement : planification bi-niveau par points de passage pour systèmes multi-robots
1arXiv cs.RO 

Navigating l'encombrement : planification bi-niveau par points de passage pour systèmes multi-robots

Des chercheurs de l'Université de Californie à Santa Barbara (UCSB, laboratoire NLP-Chang) ont publié sur arXiv (référence 2604.21138) un framework hybride de contrôle multi-robots capable de planifier simultanément à deux niveaux : la planification de tâches à haut niveau (quel robot fait quoi, dans quel ordre) et la planification de trajectoires à bas niveau (comment éviter les collisions). Le système repose sur une représentation compacte appelée "waypoints", des points de passage intermédiaires qui paramétrisent les trajectoires motrices de façon plus légère qu'une optimisation de trajectoire continue. Pour entraîner le tout, l'équipe utilise un algorithme RLVR (Reinforcement Learning with Verifiable Rewards) modifié, combiné à une stratégie de curriculum progressif qui remonte les retours de faisabilité physique du planificateur bas niveau vers le planificateur haut niveau. Les expériences sont conduites sur BoxNet3D-OBS, un benchmark multi-robots 3D à obstacles denses, avec des configurations allant jusqu'à neuf robots simultanément. Sur ce benchmark, l'approche surpasse de manière consistante les baselines "motion-agnostic" (qui ignorent les contraintes physiques) et les baselines fondées sur des VLA (Vision-Language-Action models). Ce résultat pointe un problème structurel souvent minimisé dans la littérature : l'affectation du crédit entre les deux niveaux de planification. Quand un système multi-robots échoue, est-ce que la tâche était mal assignée ou la trajectoire physiquement infaisable ? Cette ambiguïté rend les approches séquentielles (planifier les tâches, puis les trajectoires) fragiles dès que l'environnement est encombré. Le fait que les modèles VLA, pourtant en vogue depuis les travaux pi-0, GR00T N2 et Helix, sous-performent sur ce benchmark suggère que leur capacité de généralisation atteint ses limites dès qu'on ajoute des contraintes de collision à grande échelle : bonne nouvelle pour les approches d'optimisation hybride, mauvaise nouvelle pour ceux qui misent sur les VLA comme solution universelle en entrepôt. Ce travail s'inscrit dans une tendance de fond : appliquer les techniques de raisonnement par renforcement issues du traitement du langage naturel (notamment la famille DeepSeek-R1 et RLVR) à la robotique multi-agents. Les systèmes concurrents dans cet espace incluent les travaux sur TAMP (Task and Motion Planning) de MIT CSAIL et CMU, ainsi que les approches de planification décentralisée type MAPF (Multi-Agent Path Finding). Le code est disponible sur GitHub (UCSB-NLP-Chang/navigate-cluster). Les prochaines étapes probables incluent une validation sur robots physiques et une montée en charge au-delà de neuf agents, terrain où les questions de latence de planification deviendront critiques pour des déploiements industriels réels.

RecherchePaper
1 source
REACT : Architecture adaptative pour la navigation en formation continue de robots mobiles à roues
2arXiv cs.RO 

REACT : Architecture adaptative pour la navigation en formation continue de robots mobiles à roues

Des chercheurs ont déposé sur arXiv (réf. 2605.18441, mai 2026) un article décrivant REACT (Real-time Environment-Adaptive architecture for Continuous formation navigaTion), une architecture hiérarchique pour la navigation en formation de robots mobiles à roues (WMR). L'architecture se divise en deux couches : une couche supérieure qui génère des formations adaptées à l'environnement en temps réel et calcule des affectations robot-cible sans conflits via l'algorithme TCF-R2T (Trajectory-Conflict-Free Robot-to-Target assignment), dont la complexité est garantie polynomiale ; et une couche inférieure où chaque robot exécute JSTP (Joint Spatio-Temporal trajectory Planning), une méthode qui optimise simultanément positions spatiales et durées temporelles pour maintenir la formation en continu. L'ensemble a été validé en simulation et lors d'expériences en conditions réelles, dont les séquences vidéo sont publiées sur le site du projet. La contribution principale de REACT face à l'existant est son adaptabilité dynamique : la grande majorité des travaux publiés sur la navigation en formation impose des configurations prédéfinies, incapables de réagir aux obstacles dynamiques ou à des environnements non balisés. Pour les applications industrielles visées (logistique de transport, surveillance environnementale, opérations de secours), cette rigidité constitue le principal frein au déploiement réel. La garantie polynomiale de TCF-R2T est particulièrement significative sur le plan de la scalabilité : elle indique que le calcul des affectations reste tractable à mesure que la taille de la flotte augmente, contrairement aux approches combinatoires qui deviennent rapidement inextricables. La coordination spatio-temporelle de JSTP réduit par ailleurs les risques de collisions inter-agents lors des transitions de formation, un point de friction classique dans les systèmes multi-robots. La commande de formation de robots mobiles est un champ de recherche actif depuis les années 2000, avec des approches classiques basées sur le suivi de leader, les structures virtuelles ou les champs de potentiel. REACT s'inscrit dans une tendance plus récente vers des architectures hybrides centralisé/distribué, une direction explorée tant dans les milieux académiques que par des éditeurs de flottes AMR tels qu'Exotec ou Balyo côté européen. L'article reste toutefois au stade de la preuve de concept : aucune entreprise partenaire ni timeline de commercialisation n'est mentionnée, et la taille des flottes testées en conditions réelles n'est pas précisée dans le résumé. La prochaine étape logique serait un pilote à plus grande échelle en entrepôt ou en environnement de secours structuré, pour valider le passage à des flottes de taille industrielle.

UELes acteurs européens de flottes AMR comme Exotec et Balyo pourraient bénéficier de cette architecture adaptative si elle est validée à l'échelle industrielle, réduisant un frein clé au déploiement réel de flottes multi-robots.

RecherchePaper
1 source
Modèle du monde pour la navigation sociale de robots guidée par la logique
3arXiv cs.RO 

Modèle du monde pour la navigation sociale de robots guidée par la logique

Des chercheurs ont publié NaviWM (Navigation World Model), un système de navigation robotique socialement consciente qui couple un grand modèle de langage (LLM) avec un modèle de monde structuré et un module de raisonnement logique déductif. Le système repose sur deux composants principaux : un modèle spatio-temporel qui capture en temps réel les positions, vitesses et activités des agents présents dans l'environnement, et un module de raisonnement par chaîne-de-pensée (chain-of-thought) guidé par des règles formelles. La nouveauté centrale est l'encodage des normes sociales en logique du premier ordre (first-order logic), ce qui rend le raisonnement du robot vérifiable et interprétable, contrairement aux approches par prompt engineering ou fine-tuning. Les expériences menées montrent une amélioration du taux de succès de navigation et une réduction des violations sociales dans les environnements encombrés. L'article, disponible en version 2 sur arXiv (référence 2510.23509), est accompagné de vidéos de démonstration publiées par les auteurs. Ce travail s'attaque à une faille bien documentée des LLM appliqués à la planification de trajectoires en robotique mobile : le manque d'ancrage physique et de cohérence logique lorsqu'ils opèrent seuls. En environnements dynamiques peuplés d'humains, les LLM purs produisent des comportements imprévisibles, voire dangereux. En ajoutant une couche de raisonnement formel en aval du LLM sous des contraintes explicites (espace personnel, évitement de collision, gestion du timing), NaviWM propose une solution plus robuste. Pour un intégrateur travaillant sur des robots de service en intérieur, livraison hospitalière ou navigation en entrepôt mixte humain-robot, cela représente un levier concret pour réduire le gap entre démonstration en laboratoire et déploiement opérationnel. Le caractère interprétable du raisonnement constitue également un atout pour les exigences de traçabilité et de certification en milieu industriel ou médical. La navigation sociale pour robots mobiles est un champ en forte effervescence, où coexistent des approches classiques comme ORCA (Optimal Reciprocal Collision Avoidance), des prédicteurs à base de réseaux LSTM sociaux, et plus récemment des systèmes intégrant des VLA (Vision-Language-Action models) comme Pi-0 ou les architectures embarquées de Boston Dynamics et Figure. NaviWM se positionne dans un segment distinct : il ne cherche pas à remplacer le LLM mais à le contraindre via un modèle du monde explicite et des règles formelles, une approche hybride neuro-symbolique proche des travaux du MIT CSAIL sur la planification task-and-motion. Les prochaines étapes naturelles seront de valider l'architecture sur des plateformes physiques hors simulation et de tester la robustesse des règles logiques face à des scénarios sociaux non anticipés lors de leur encodage initial.

RecherchePaper
1 source
Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots
4arXiv cs.RO 

Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots

Des chercheurs ont publié sur arXiv (référence 2504.17679) un framework de navigation intérieure combinant deux familles d'algorithmes jusqu'ici utilisées séparément : la reachability hamiltonienne-jacobienne (HJ), calculée hors-ligne, et la recherche sur graphe, exécutée en ligne. Le principe : les fonctions de valeur HJ, précomputées sur la géométrie de l'environnement, servent à la fois d'heuristiques informatives et de contraintes de sécurité proactives pour guider la recherche sur graphe en temps réel. Le système a été validé en simulation extensive et dans des expériences en conditions réelles, incluant des environnements avec présence humaine. Aucun modèle de robot spécifique ni aucune entreprise commerciale ne sont mentionnés dans la publication, qui s'inscrit dans un cadre académique pur. L'intérêt principal de cette approche réside dans la gestion du compromis entre sécurité garantie et efficacité computationnelle, un point de friction classique pour les robots mobiles en intérieur (AMR, plateformes logistiques). La reachability HJ offre des garanties théoriques solides sur l'évitement d'obstacles, mais elle souffre d'une limitation structurelle : elle suppose une connaissance complète de l'environnement, ce qui la rend difficilement applicable à des espaces dynamiques ou partiellement inconnus. En intégrant la reachability comme heuristique plutôt que comme planificateur principal, les auteurs contournent cette contrainte tout en amortissant le coût de calcul en ligne. Les résultats annoncés montrent une amélioration consistante face aux méthodes de référence, tant en efficacité de planification qu'en sécurité, mais les métriques précises (temps de cycle, taux de collision) ne sont pas détaillées dans le résumé disponible. La reachability HJ est un outil issu de la théorie du contrôle optimal, historiquement utilisé pour la vérification formelle de systèmes cyber-physiques. Son application à la robotique mobile n'est pas nouvelle, mais son couplage avec des algorithmes de recherche sur graphe type A* pour surmonter la contrainte de connaissance globale de l'environnement représente une direction de recherche active. Ce travail se positionne face aux approches purement apprentissage (VLA, politiques end-to-end) en revendiquant des garanties formelles absentes des méthodes neuronales. Les prochaines étapes naturelles incluent l'extension à des espaces 3D ou à des robots non-holonomes, ainsi qu'une validation sur des plateformes industrielles réelles.

RecherchePaper
1 source