
MORN : régulation métacognitive des objectifs pour une navigation à long horizon économe en ressources
Des chercheurs ont publié MORN (Metacognitive Object-goal Regulation Navigation) sur arXiv (2605.16932), une architecture de contrôle exécutif conçue pour les robots autonomes chargés de missions longues et séquentielles dans des environnements non structurés. Le scénario typique visé : un robot doit localiser successivement une tasse, une chaise, puis une imprimante dans un bâtiment inconnu, avec des contraintes strictes de temps et d'énergie. Évalué sur le dataset HM3D (Habitat-Matterport 3D), MORN améliore le taux de complétion des objectifs (Goal Completion Rate) de 0,23 à 0,30, soit une progression de 30 %, tout en réduisant la fraction de pas gaspillés (Wasted Step Fraction) de 0,90 à 0,70. L'architecture s'intègre sans modification des backbones de navigation existants, ce qu'elle augmente via un meta-contrôleur plug-in.
Le problème adressé est concret et sous-estimé dans la littérature robotique : les agents ObjectNav modernes basés sur des VLMs (Vision-Language Models) sont purement réactifs. Ils localisent des cibles sémantiques efficacement, mais ignorent totalement l'état global de la mission. Résultat : ils s'acharnent sur des sous-objectifs devenus inatteignables, épuisant batterie et temps sur ce que les auteurs appellent des "zombie goals". Pour les intégrateurs et COOs qui évaluent des flottes de robots mobiles en entrepôt ou en milieu hospitalier, c'est un vrai point de friction opérationnel. MORN propose d'y remédier via trois états neuro-cognitifs formalisés : le Potentiality Index (estimation de la faisabilité d'un sous-objectif), le Persistence Gating (décision d'abandon anticipé), et l'Evidence Accumulation (agrégation perceptuelle pour réduire l'incertitude). Ce mécanisme est présenté comme une neutralisation du biais du coût irrécupérable ("Sunk Cost Fallacy"), appliqué à la planification robotique.
L'inspiration théorique est explicitement la Dual-Process Theory issue des sciences cognitives, popularisée par Kahneman : System 1 (locomotion réactive, rapide) supervisé par un System 2 (méta-raisonnement, lent et global). Ce cadre conceptuel est mobilisé dans la robotique depuis quelques années, notamment dans les travaux sur les agents LLM incarnés, mais son application formalisée à la gestion de ressources en ObjectNav reste peu explorée. Le champ concurrent direct inclut les architectures VLM-as-planner (SQA3D, EmbodiedScan, ESC) et les méthodes end-to-end de navigation zéro-shot. Aucun déploiement industriel n'est annoncé à ce stade : il s'agit d'une contribution de recherche académique, avec des résultats sur simulateur uniquement. La question du transfert sim-to-real sur hardware physique reste ouverte, ce qui est le principal écart à surveiller avant toute considération d'intégration.
Dans nos dossiers




