RecherchearXiv cs.RO1h

MoPe : permanence du mouvement pour une cartographie gaussienne monoculaire robuste en environnements dynamiques

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de recherche publie en préimpression sur arXiv (2606.29237) une méthode baptisée MoPe (Motion Permanence) qui vise à corriger un défaut structurel des systèmes de cartographie par Gaussian Splatting monoculaire en environnements dynamiques. Le problème ciblé est précis : les approches actuelles de SLAM avec Gaussian Splatting traitent chaque image de manière indépendante pour décider si une région est dynamique ou statique. Résultat, quand un piéton ralentit, s'arrête ou réapparaît après une occultation, la trame courante semble statique et le système intègre ce contenu mobile dans la carte permanente, générant des artefacts de type "fantôme" (ghosting). MoPe repose sur un principe qu'il nomme Motion Permanence : l'identité dynamique d'un objet doit persister dans le temps plutôt qu'être réévaluée à chaque image. Concrètement, la méthode propage le posterior dynamique historique via un warping géométriquement cohérent en SE(3), puis le fusionne avec les observations de la trame courante par mises à jour bayésiennes en log-odds bornées. Ce posterior persistant pilote le suivi, la cartographie, l'insertion sélective de gaussiennes et un post-nettoyage par gaussienne individuelle. Les auteurs évaluent MoPe sur trois benchmarks publics (Wild-SLAM, Bonn, TUM) et rapportent des gains de robustesse en tracking et une réduction des ghosting, avec les améliorations les plus marquées sur les séquences à humains dynamiques.

L'enjeu pour les intégrateurs et les équipes de navigation autonome est direct : un SLAM qui "hallucine" des obstacles statiques là où un piéton s'était simplement immobilisé dégrade la planification de trajectoire et la prise de décision en aval. En introduisant une mémoire temporelle au niveau de la représentation de scène elle-même, MoPe traite le problème à la racine plutôt qu'en post-filtrage. La méthode prouve qu'un filtre d'incertitude à mémoire, relativement léger à implémenter, suffit à franchir une partie du fossé entre les démos en laboratoire et les déploiements réels en environnements peuplés, sans recourir à une caméra stéréo ou à un LiDAR.

Le Gaussian Splatting appliqué au SLAM est un domaine en effervescence depuis 2023, porté par des travaux comme SplaTAM, MonoGS et GaussianSLAM, qui ont démontré la faisabilité d'une cartographie haute-fidélité en temps réel à partir d'une seule caméra. MoPe s'inscrit dans la vague des méthodes qui cherchent à rendre ces représentations exploitables hors des environnements contrôlés, aux côtés d'approches concurrentes comme RobustSplat ou les variantes uncertainty-aware de MonoGS. Il s'agit pour l'instant d'une préimpression non revue par les pairs, sans code publié ni validation sur robot réel annoncée, ce qui invite à tempérer les conclusions : les gains mesurés sur séquences vidéo ne garantissent pas un comportement équivalent sur plateforme embarquée avec contraintes temps-réel. Les prochaines étapes naturelles seront l'intégration dans un pipeline de navigation complet et la validation sur datasets intérieurs type HM3D ou ScanNet avec scènes plus peuplées.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques

Des chercheurs ont publié sur arXiv (ref. 2504.11901, cinquième version) un framework de prise de décision basé sur l'inférence causale pour les robots mobiles autonomes (AMR) évoluant dans des environnements partagés avec des humains. Plutôt que de s'appuyer uniquement sur des corrélations statistiques, leur système apprend un modèle causal explicite des dynamiques d'environnement, notamment l'estimation de la consommation batterie et les risques d'obstruction par des passants, pour décider quand et comment exécuter une tâche. Pour valider leur approche, l'équipe a développé PeopleFlow, un simulateur basé sur Gazebo capable de générer des trajectoires réalistes de multiples agents (humains et robots) en tenant compte de facteurs contextuels comme l'heure, la configuration spatiale et l'état du robot. Le cas d'usage principal est un entrepôt en activité partagée, benchmark face à une baseline non-causale classique. L'apport principal est de déplacer la logique de décision de la corrélation vers la causalité, une distinction non triviale en robotique opérationnelle. Là où un système standard détecte qu'il y a "souvent du monde à 14h dans l'allée B" et l'évite, un modèle causal comprend pourquoi, ce qui lui permet d'anticiper des situations nouvelles et de planifier la minuterie d'une tâche logistique en conséquence. Pour un COO gérant une flotte d'AMR dans un entrepôt mutualisé avec des préparateurs de commandes, cela se traduit potentiellement par moins d'arrêts non planifiés, une meilleure gestion de la charge batterie, et une cohabitation plus fluide. Il convient toutefois de noter que les résultats présentés sont exclusivement issus de simulation, sans validation terrain, ce qui constitue une limite importante à ce stade. Ce travail s'inscrit dans un contexte de déploiement croissant d'AMR dans des espaces mixtes, des entrepôts e-commerce aux hôpitaux, où des acteurs comme MiR (Teradyne), Locus Robotics ou le français Exotec font face à des défis de navigation sociale de plus en plus complexes. La recherche en planification causale reste largement académique, mais elle trace une voie complémentaire aux approches par apprentissage par renforcement ou par règles explicites. La prochaine étape logique serait une validation sur robot physique en environnement réel, un passage sim-to-real que l'article n'adresse pas encore.

UELes opérateurs français d'AMR comme Exotec, confrontés à la navigation en entrepôts partagés avec des préparateurs humains, sont le public cible naturel de ce framework, mais l'absence de validation terrain limite l'applicabilité immédiate.

RecherchePaper

1 source

2arXiv cs.RO

Saisie mobile avec conscience de la visibilité en environnements dynamiques

Des chercheurs ont publié sur arXiv (arXiv:2605.02487) un système de préhension mobile baptisé « visibility-aware mobile grasping », conçu pour des robots à manipulateur opérant dans des environnements inconnus et dynamiques. L'architecture repose sur deux composants couplés : un planificateur bas niveau en corps entier (whole-body planner) associé à une perception active sensible à la vitesse, et un planificateur haut niveau hiérarchique fondé sur des arbres de comportement (behavior trees) qui génère des sous-objectifs adaptatifs. Les expériences ont été conduites sur 400 scénarios de simulation randomisés ainsi qu'en déploiement réel sur un robot mobile manipulateur Fetch. Le système atteint un taux de succès de 68,8 % dans des environnements statiques inconnus et de 58,0 % dans des environnements dynamiques, soit respectivement +22,8 et +18,0 points de pourcentage par rapport à l'approche de référence NAM (Non-prehensile Assisted Manipulation), avec une réduction mesurée des collisions. Le problème central que ce travail cherche à résoudre est un compromis fondamental en robotique mobile : un robot disposant d'un champ de vision limité doit arbitrer en permanence entre explorer pour réduire l'incertitude environnementale et progresser vers sa cible de saisie dans un espace de configuration à haute dimensionnalité. Les approches précédentes découpaient ces deux objectifs, ce qui rendait impossible la garantie de sécurité lorsque des obstacles dynamiques non observés intersectaient la trajectoire pendant la manipulation. En couplant la perception active à la planification de mouvement, et non en les traitant en séquence, les auteurs montrent qu'il est possible de maintenir une garantie de sécurité sans sacrifier les performances de saisie, un résultat pertinent pour les intégrateurs de systèmes pick-and-place en environnement non contrôlé. Ce travail s'inscrit dans un courant de recherche en pleine accélération autour des robots mobiles manipulateurs capables d'opérer hors de cellules balisées. Le Fetch, plateforme de recherche standard de Fetch Robotics (racheté par Zebra Technologies), est un choix délibérément accessible pour la reproductibilité. Les concurrents directs sur ce segment incluent les travaux de Mobile ALOHA (Stanford), de Spot Arm (Boston Dynamics) et de Hello Robot Stretch, ainsi que les systèmes AMR-à-bras d'Universal Robots et de Kassow Robots en Europe. La prochaine étape naturelle identifiée implicitement par les auteurs est l'extension à des scénarios avec plusieurs objets dynamiques simultanés et des environnements encore moins structurés, un écart entre performances en simulation et déploiement réel qui reste à confirmer sur des cycles industriels prolongés.

RecherchePaper

1 source

3arXiv cs.RO

Allocation de tâches et planification du mouvement en environnements dynamiques encombrés via CBBA et graphes d'ensembles convexes

Une équipe de chercheurs a publié sur arXiv (référence 2506.18516) un système de planification combinant deux algorithmes complémentaires pour coordonner des agents mobiles dans des environnements encombrés et dynamiques : le CBBA (Consensus-Based Bundle Algorithm) pour l'allocation distribuée des tâches, et les GCS (Graphs of Convex Sets) pour l'optimisation des trajectoires. L'approche repose sur un espace de configuration en 4D (3D spatial plus axe temporel), ce qui permet de modéliser simultanément la géométrie de l'environnement et le timing des rendez-vous mobiles. Les agents doivent non seulement se répartir les tâches, mais également estimer précisément quand et où ils pourront les atteindre, compte tenu des obstacles et des autres agents. Les résultats sont démontrés exclusivement en simulation, avec des scénarios incluant des tâches statiques et des objectifs de rendez-vous dynamiques. L'apport technique principal réside dans le couplage explicite entre allocation et planification, deux sous-problèmes généralement traités séparément dans la littérature sur les systèmes multi-robots. En pratique, la plupart des architectures industrielles de type AMR (Autonomous Mobile Robot) utilisent un planificateur de chemin découplé du système de dispatch, ce qui introduit des erreurs d'estimation temporelle et des conflits de ressources. En intégrant les GCS dans la boucle CBBA, le système produit des enchères basées sur des trajectoires réellement faisables plutôt que sur des heuristiques de distance euclidienne. Pour un intégrateur ou un décideur B2B, cela signifie potentiellement moins de recalculs coûteux en exécution et une meilleure fiabilité des estimations de temps de cycle dans des entrepôts ou ateliers denses. Il faut néanmoins noter que les GCS, bien que performants en optimisation convexe, restent computationnellement lourds à grande échelle, et que l'article ne fournit pas de données de timing comparatives. Les GCS ont été popularisés principalement par les travaux de Tobia Marcucci et Russ Tedrake au MIT via la librairie Drake, avec des applications initiales en manipulation et locomotion. Le CBBA est issu des travaux du MIT Lincoln Laboratory (Choi et al., 2009) et reste une référence en coordination décentralisée pour drones et robots terrestres. Cette combinaison s'inscrit dans un effort plus large pour combler le fossé entre planification géométrique et coordination multi-agent, un problème actif dans des labos comme Stanford ASL, CMU Robotics Institute, ou côté français l'INRIA et le LAAS-CNRS. Les prochaines étapes naturelles seraient une validation sur matériel réel, une évaluation de la scalabilité au-delà d'une dizaine d'agents, et une comparaison quantitative avec des approches basées sur MILP ou MAPF (Multi-Agent Path Finding).

UEL'INRIA et le LAAS-CNRS sont explicitement cités comme acteurs actifs sur cette problématique, positionnant la recherche française en bonne place pour contribuer ou collaborer autour de cette méthodologie de planification multi-agents.

RecherchePaper

1 source

4Interesting Engineering

La puce 6 mW du MIT permet aux mini-drones de voir et cartographier leur environnement en temps réel

Des chercheurs du MIT ont présenté à l'IEEE VLSI Symposium un système-sur-puce baptisé Gleanmer, capable de construire des cartes 3D détaillées de l'environnement en temps réel avec une consommation d'environ 6 milliwatts. La puce cible les plateformes à très faible autonomie énergétique : micro-drones, robots embarqués, et potentiellement casques de réalité augmentée légers. Ses applications directes incluent la navigation en milieux confinés, systèmes de ventilation industriels, entrepôts, tunnels, où l'évitement d'obstacles est critique et où embarquer un GPU classique est hors de question. L'équipe, conduite par Vivienne Sze (professeure de génie électrique et informatique au MIT) et les co-premiers auteurs Peter Zhi Xuan Li et Zih-Sing Fu, a couplé le silicium à un algorithme de cartographie maison nommé GMMap. Plutôt que de recourir aux représentations voxel classiques (des millions de petits cubes), GMMap modélise l'espace avec des ellipsoïdes gaussiens flexibles qui encodent les surfaces courbes et les espaces ouverts en consommant nettement moins de mémoire. L'algorithme traite chaque image de profondeur en un seul passage et peut fusionner les gaussiennes redondantes, celles générées quand le robot observe le même objet sous plusieurs angles, sans avoir à relire les données brutes. Résultat : seuls quelques pixels doivent résider en mémoire à tout instant, et la majeure partie des données actives tient dans la SRAM on-chip rapide, évitant les accès coûteux à une mémoire externe. Ce niveau de frugalité est significatif pour le secteur. Gleanmer consomme environ 2,5 % de l'énergie exigée par la meilleure puce de cartographie existante selon les benchmarks publiés par l'équipe, et réduit la consommation de la planification de trajectoire sans collision à environ 20 % de la référence habituelle. Pour les intégrateurs qui travaillent sur des plateformes à budget énergétique serré (nano-drones de 50 g, robots d'inspection en tube, wearables industriels), la différence entre 250 mW et 6 mW n'est pas marginale : elle conditionne la durée de mission et le dimensionnement de la batterie. La puce a également démontré sa capacité à reconstruire des obstacles et espaces libres en direct à partir du flux vidéo d'une caméra iPhone, ce qui ouvre une voie vers des prototypes rapides sans matériel dédié. Le MIT n'est pas seul sur ce terrain. Intel Labs, Qualcomm et plusieurs startups spécialisées en edge AI (Syntiant, Perceive) travaillent à réduire l'empreinte des pipelines de perception embarquée. Mais l'angle co-design algorithme-hardware du groupe de Vivienne Sze, déjà connu pour des travaux similaires sur les accélérateurs de réseaux de neurones, distingue Gleanmer d'une approche purement matérielle. Les chercheurs envisagent de rapprocher davantage les ressources de calcul des capteurs pour gagner encore en efficacité lors des prochaines itérations, et explorent si les représentations gaussiennes pourraient aussi accélérer le traitement de plans techniques et de schémas complexes, au-delà du seul domaine robotique. Aucun calendrier de commercialisation ni partenaire industriel n'ont été annoncés à ce stade.

RecherchePaper

1 source