Aller au contenu principal
BIM-Loc : localisation intérieure par LiDAR intégrée au BIM et sensible aux écarts
RecherchearXiv cs.RO2h

BIM-Loc : localisation intérieure par LiDAR intégrée au BIM et sensible aux écarts

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs publie BIM-Loc sur arXiv (identifiant 2606.14237), une méthode de localisation LiDAR pour robots de service et d'inspection en intérieur qui exploite directement les maquettes numériques BIM (Building Information Model) issues de la phase de conception des bâtiments, sans nécessiter la création préalable d'une carte dédiée. Le système estime en temps réel la trajectoire du robot dans le repère de coordonnées BIM et détecte simultanément les écarts entre l'environnement réel et la maquette as-designed. Trois contributions techniques structurent l'approche : un algorithme de lancer de rayons multi-impact pour associer les points LiDAR aux surfaces BIM et projeter les observations 3D dans un espace de texture 2D ; un cadre d'optimisation par graphe de poses intégrant des facteurs BIM pour garantir la cohérence entre l'odométrie, les scans successifs et la géométrie du bâtiment ; et un module d'inférence bayésienne hiérarchique qui met à jour de façon incrémentale une représentation surfacique 2D continue, en propageant les détections du pixel jusqu'au niveau structurel.

L'enjeu central est la localisation dans les environnements intérieurs peu distinctifs, couloirs d'hôpitaux, open spaces, entrepôts, où les systèmes SLAM classiques échouent faute de repères géométriques saillants. BIM-Loc contourne ce problème en utilisant une source de données déjà présente dans la majorité des bâtiments modernes : le fichier BIM produit lors de la conception. Pour les intégrateurs de robots de service, cela supprime l'étape coûteuse de cartographie préalable et permet un déploiement rapide. La capacité de détection des écarts apporte également une valeur concrète pour les missions d'inspection de conformité, en signalant automatiquement les modifications non documentées d'un bâtiment. Selon les auteurs, BIM-Loc surpasse significativement les méthodes map-based de l'état de l'art en précision et en robustesse, bien que les métriques précises (RMSE, ATE) ne soient pas détaillées dans l'abstract.

La localisation en intérieur reste un problème ouvert depuis les premières générations de robots mobiles. Les approches dominantes, SLAM 2D/3D, localisation Monte Carlo, NDT matching, reposent sur des cartes issues de relevés terrain, ce qui pose des problèmes de maintenance dans les environnements changeants. L'utilisation des BIM comme prior a été explorée dans des travaux antérieurs en réalité augmentée pour le BTP, mais leur intégration dans un pipeline de localisation temps réel avec détection de discordances constitue une contribution distincte. Dans l'espace concurrent, des systèmes comme Cartographer (Google) ou les solutions propriétaires de MiR opèrent principalement avec des grilles d'occupation 2D. Aucun partenariat industriel ni calendrier de transfert technologique n'est mentionné dans ce preprint ; la prochaine étape naturelle serait une validation dans des environnements à forte densité de personnes en mouvement.

Impact France/UE

L'adoption du BIM étant réglementairement encouragée dans les marchés publics européens, la méthode pourrait faciliter le déploiement de robots de service dans des bâtiments déjà dotés de maquettes numériques, mais aucune entreprise ou institution française ou européenne n'est impliquée dans ces travaux.

Dans nos dossiers

À lire aussi

Localisation SLAM multi-session par texture au sol en environnements peu dynamiques
1arXiv cs.RO 

Localisation SLAM multi-session par texture au sol en environnements peu dynamiques

Des chercheurs ont publié sur arXiv (identifiant 2605.19701) une étude portant sur le SLAM multi-session par texture de sol dans des environnements à faible dynamique de changement. Le SLAM (Simultaneous Localization and Mapping) basé sur la texture du sol utilise uniquement les patterns visuels du plancher comme repère cartographique, sans marqueurs physiques ni infrastructure dédiée. L'article évalue trois techniques pour améliorer la précision d'estimation de trajectoire dans des environnements où le sol évolue lentement entre sessions : usure de surface, phénomènes météorologiques, variations saisonnières. Parmi ces approches, l'utilisation de la divergence de Kullback-Leibler (KLD), une mesure de dissimilarité entre distributions de probabilité, comme score de similarité et comme biais influençant la confiance dans la détection de bouclage de trajectoire (loop closure), s'est révélée la plus performante. L'équipe met également à disposition un dataset public contenant des images multi-sessions de sol avec variations entre sessions et des données de pose haute précision pour évaluation comparative. La gestion multi-session est un prérequis opérationnel souvent sous-estimé dans les déploiements longue durée de robots mobiles autonomes (AMR) en environnements peu texturés : entrepôts à sols lisses, couloirs hospitaliers, zones de production industrielle. Un robot contraint de reconstruire intégralement sa carte après chaque redémarrage, maintenance ou changement saisonnier génère des interruptions de service et des coûts opérationnels qui compromettent la viabilité à l'échelle. La capacité à détecter des correspondances fiables entre sessions malgré une évolution lente du terrain constitue un pas concret vers des systèmes SLAM "lifelong" exploitables en production, et la KLD semble offrir ici un avantage mesurable sur les métriques de similarité classiques. Le SLAM par texture de sol s'est développé comme alternative aux systèmes LiDAR et aux réseaux de marqueurs au sol dans des contextes où l'infrastructure est coûteuse ou non autorisée, mais les travaux antérieurs restaient limités aux opérations mono-session. Les systèmes AMR commerciaux de référence, notamment ceux d'Exotec pour la logistique française ou les plateformes de navigation d'entrepôt fondées sur LiDAR 2D, s'appuient encore sur des capteurs actifs ou des repères fixes. Cette publication s'inscrit dans l'effort croissant de la communauté SLAM pour traiter les environnements "low-dynamic", zone intermédiaire entre statique et hautement dynamique qui représente pourtant la majorité des déploiements industriels réels. Le dataset public est la contribution la plus directement réutilisable, ouvrant la voie à un benchmark standardisé entre méthodes concurrentes.

UELe dataset public et la méthode KLD offrent une piste concrète pour les équipes R&D travaillant sur des AMR longue durée en environnements industriels européens (entrepôts logistiques, couloirs hospitaliers), en réduisant les interruptions de service liées aux reconfigurations cartographiques multi-sessions.

RecherchePaper
1 source
Détection structurelle en temps réel pour la navigation intérieure par LiDAR 3D avec images en vue aérienne
2arXiv cs.RO 

Détection structurelle en temps réel pour la navigation intérieure par LiDAR 3D avec images en vue aérienne

Des chercheurs ont publié sur arXiv (arXiv:2603.19830v2) un pipeline de perception léger capable de détecter en temps réel les structures d'un environnement intérieur à partir de données LiDAR 3D, sans recourir à un GPU. Le principe : projeter le nuage de points 3D en images Bird's-Eye-View (BEV) 2D, puis appliquer un détecteur sur cette représentation compressée. L'équipe a comparé quatre approches de détection de structures (murs, couloirs, portes) : la transformée de Hough, RANSAC, LSD (Line Segment Detector) et un réseau YOLO-OBB (Oriented Bounding Box). Les expériences ont été conduites sur une plateforme robotique mobile standard équipée d'un single-board computer (SBC) à faible consommation. Résultat : YOLO-OBB est la seule méthode à satisfaire la contrainte temps réel de 10 Hz en bout de chaîne, là où RANSAC dépasse les budgets de latence et LSD génère une fragmentation excessive de segments qui sature le système. Un module de fusion spatiotemporelle stabilise les détections entre frames consécutives. L'intérêt opérationnel est direct pour les intégrateurs de robots mobiles autonomes (AMR) fonctionnant sur du matériel embarqué standard, typiquement des SBC ARM sans accélérateur dédié. Démontrer qu'un détecteur basé YOLO-OBB tient 10 Hz sur ce type de plateforme réduit le coût matériel des solutions de cartographie et navigation indoor, un verrou persistant dans le déploiement à grande échelle d'AMR en entrepôt ou en milieu hospitalier. L'approche BEV contourne également la complexité computationnelle des traitements de nuages de points 3D complets (méthodes de type PointNet, VoxelNet), qui restent prohibitifs hors GPU. La mise à disposition du code source et des modèles pré-entraînés facilite la reproductibilité et l'adaptation industrielle. Ce travail s'inscrit dans un courant de recherche actif visant à rendre la perception robotique robuste accessibles aux plateformes contraintes en ressources, en concurrence directe avec des approches comme les architectures 2D range-image ou les méthodes pillars (PointPillars). Sur le plan de la navigation indoor, il complète des stacks SLAM existants (Cartographer, RTAB-Map) en ajoutant une couche de détection structurelle explicite, utile pour la planification de trajectoires en espaces semi-structurés. Les prochaines étapes logiques incluent la validation sur des scénarios plus denses (open space vs couloirs étroits), ainsi que l'intégration dans des boucles de localisation et cartographie continues, où la stabilité temporelle du module de fusion sera mise à l'épreuve à plus grande échelle.

RecherchePaper
1 source
Localisation par angle et contrôle de rigidité pour réseaux multi-robots
3arXiv cs.RO 

Localisation par angle et contrôle de rigidité pour réseaux multi-robots

Des chercheurs ont publié sur arXiv (référence 2604.11754v2) une contribution théorique et algorithmique portant sur la localisation par mesures d'angles et le maintien de rigidité dans les réseaux multi-robots, en 2D et en 3D. Le résultat central établit une équivalence formelle entre rigidité angulaire et rigidité de type "bearing" (orientation relative) pour des graphes de détection dirigés avec mesures en référentiel embarqué : un système dans SE(d) est infinitésimalement rigide au sens bearing si et seulement s'il est infinitésimalement rigide au sens angulaire et que chaque robot acquiert au moins d-1 mesures de bearing (d valant 2 ou 3). À partir de cette base, les auteurs proposent un schéma de localisation distribué et démontrent sa stabilité exponentielle locale sous des topologies de détection commutantes, avec comme seule hypothèse la rigidité angulaire infinitésimale sur l'ensemble des topologies visitées. Une nouvelle métrique, la valeur propre de rigidité angulaire, est introduite pour quantifier le degré de rigidité du réseau, et un contrôleur décentralisé par gradient est proposé pour maintenir cette rigidité tout en exécutant des commandes de mission. Les résultats sont validés par simulation. L'intérêt pratique de ce travail réside dans le choix des mesures angulaires plutôt que des distances ou des orientations absolues : les angles entre vecteurs de direction peuvent être extraits directement depuis des caméras embarquées à bas coût, sans capteur de distance actif ni accès GPS. Pour les intégrateurs de systèmes multi-robots, notamment en essaims de drones ou en robotique entrepôt avec coordination décentralisée, la robustesse sous topologies commutantes est critique, car les lignes de vue entre agents changent constamment. Le contrôleur proposé adresse ce problème en maintenant activement une configuration spatiale suffisamment rigide pour garantir l'observabilité du réseau, ce qui évite les dégradations silencieuses de localisation que l'on observe dans les déploiements réels. C'est une avancée sur le problème dit du "rigidity maintenance", encore peu traité dans la littérature avec des garanties formelles en 3D. La rigidité de réseau comme fondation pour la localisation distribuée est un domaine actif depuis les travaux fondateurs sur la formation control et les frameworks d'Henneberg dans les années 2010. Les approches concurrentes incluent la localisation par distances (nécessitant UWB ou radar), par bearings seuls (plus sensible aux ambiguïtés), ou par fusion IMU/SLAM embarqué par robot, chacune avec ses propres hypothèses de connectivité et de coût matériel. Ce papier se positionne dans le créneau "caméra seule, pas de métadonnées globales", pertinent pour les petits drones ou les robots à budget capteur contraint. Aucun déploiement ni partenaire industriel n'est mentionné, il s'agit d'une contribution académique pure. Les suites naturelles incluraient une validation sur plateforme physique (type Crazyflie ou quadrupèdes en formation) et l'extension aux perturbations de mesures bruitées en environnement non contrôlé.

RecherchePaper
1 source
TravExplorer : exploration incarnée inter-niveaux par planification 3D sensible à la traversabilité
4arXiv cs.RO 

TravExplorer : exploration incarnée inter-niveaux par planification 3D sensible à la traversabilité

Des chercheurs proposent TravExplorer, un framework de navigation autonome multi-étages publié en mai 2026 sur arXiv (arXiv:2605.19958). Le système s'attaque à la navigation zero-shot par objets (ZSON, Zero-Shot Object Navigation), soit la capacité à localiser une cible désignée en langage naturel dans un environnement inconnu, sans carte préalable. Validé sur 4 195 épisodes simulés dans les benchmarks HM3D (Habitat-Matterport 3D) et Matterport3D (MP3D), puis sur 50 essais réels avec un robot quadrupède Unitree Go2, TravExplorer opère sur escaliers, paliers et espaces à chevauchements verticaux. Le système maintient une carte volumétrique unifiée distinguant structures occupées et surfaces accessibles au robot, extrait des frontières traversables sur sols, escaliers et paliers, et s'appuie sur un planificateur hiérarchique couplant une recherche 3D guidée par points d'appui (foothold-guided) à une optimisation de trajectoire localement contrainte en vertical. Presque tous les systèmes ZSON existants supposent un environnement mono-étage et une représentation plane, une hypothèse qui casse dans tout bâtiment réel comportant escaliers ou mezzanines. TravExplorer comble ce fossé avec deux apports concrets : un module sémantique allégé qui aligne une carte d'instances probabiliste (segmentation open-vocabulary en ligne) avec une carte de valeur spatiale via image-to-text rapide, réduisant la latence de raisonnement ; et une stratégie de perception active FOV-aware pour résoudre les zones partiellement observées lors des transitions d'étages. Les résultats sur HM3D et MP3D sont supérieurs aux baselines ObjectNav de référence, et les 50 essais sur Go2 sans carte ni intervention humaine constituent une validation sim-to-real concrète, même si elle reste limitée à une seule plateforme et à des intérieurs contraints. Le champ du ZSON multi-étages émerge dans un contexte plus large d'ambition robotique pour les environnements non structurés. HM3D (Meta) et MP3D sont les benchmarks standards du domaine ; y surpasser les méthodes ObjectNav actuelles est un signal de maturité technique. Le Unitree Go2, quadrupède de recherche commercialisé autour de 8 700 euros, est devenu une plateforme de référence en navigation académique. Le code source sera mis à disposition sur GitHub. Les extensions logiques incluent des bâtiments plus complexes, des espaces semi-ouverts et l'intégration sur robots humanoïdes ou à roues. Aucun acteur européen n'est impliqué dans cette publication.

RecherchePaper
1 source