RecherchearXiv cs.RO6sem

Elevator-LIO : odométrie LiDAR-inertielle robuste pour la navigation multi-étages dans les ascenseurs

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié sur arXiv (arXiv:2605.24495) Elevator-LIO, un framework d'odométrie LiDAR-inertielle conçu pour maintenir la localisation continue d'un robot pendant ses déplacements en ascenseur. Le système repose sur un modèle d'estimation d'état découplé qui modélise séparément le mouvement du robot par rapport à la cabine et le mouvement de la cabine elle-même, intégré dans un filtre de Kalman itératif à erreur d'état dépendant du mode. Un gestionnaire de mode détecte l'entrée et la sortie de l'ascenseur via des statistiques de télémétrie LiDAR, puis déclenche des mises à jour de vitesse nulle et d'accélération nulle lorsque la cabine est à l'arrêt afin de supprimer la dérive verticale accumulée. Une stratégie de sous-échantillonnage voxel adaptatif maintient un nombre stable de points efficaces lors des changements d'échelle environnementale. Les tests portent sur 20 séquences réelles comprenant 79 trajets en ascenseur, couvrant des espaces de grande dimension, de longs déplacements verticaux, des piétons en mouvement et des réflexions sur miroirs. L'erreur de hauteur terminale reste inférieure à 1 cm dans 17 séquences sur 20.

Ce résultat est significatif pour les déploiements de robots mobiles autonomes (AMR) en environnement multi-étages, un cas d'usage que les systèmes LIO conventionnels gèrent mal : les accélérations non inertielles d'un ascenseur saturent le filtre IMU standard et provoquent des dérives cumulatives qui corrompent la carte et la pose estimée. Elevator-LIO démontre qu'une modélisation explicite du référentiel non inertiel, plutôt qu'un post-traitement correctif, permet une localisation robuste sans recalage a posteriori. Les auteurs indiquent également que la méthode reste compétitive sur les benchmarks Hilti 2022 et 2023, ce qui suggère qu'elle n'est pas spécialisée au détriment des scénarios intérieurs standards.

La navigation multi-étages est depuis plusieurs années l'un des verrous opérationnels majeurs pour les robots de livraison et de service en milieu tertiaire ou hospitalier. Des acteurs comme Boston Dynamics (Spot), Keenon Robotics ou Savioke affrontent ce problème avec des solutions ad hoc souvent dépendantes d'infrastructure. Dans l'écosystème européen, des entreprises comme Enchanted Tools (Miroki) ou Exotec opèrent principalement en environnement mono-niveau, mais la pression vers des déploiements bâtimentaires complets s'intensifie. Elevator-LIO est pour l'instant un prototype académique sans déploiement annoncé, mais son intégration dans des stacks LIO open-source comme FAST-LIO2 ou LIO-SAM serait techniquement directe, ce qui pourrait accélérer l'adoption industrielle.

Impact France/UE

Les acteurs français comme Enchanted Tools (Miroki) et Exotec, qui opèrent aujourd'hui principalement en environnement mono-niveau, pourraient s'appuyer sur cette technologie pour étendre leurs déploiements robotiques aux bâtiments multi-étages sans dépendre d'infrastructures dédiées.

Dans nos dossiers

Boston Dynamics Enchanted Tools — Mirokaï Exotec arXiv cs.RO

À lire aussi

1arXiv cs.RO

BIEVR-LIO : odométrie LiDAR-inertielle robuste via des cartes de voxels enrichies par images de relief

Les chercheurs à l'origine de BIEVR-LIO présentent une nouvelle méthode d'odométrie LiDAR-inertielle (LIO) conçue pour rester fiable dans les environnements pauvres en géométrie, un scénario où les techniques classiques dérivent ou divergent faute de repères suffisants pour recaler les nuages de points. Le cœur de l'approche repose sur une carte voxelisée haute résolution où chaque voxel stocke une image de hauteur orientée représentant la surface locale, ce qui permet un recalage direct sans passer par le calcul intermédiaire de primitives géométriques (plans, arêtes), tout en conservant des mises à jour de carte efficaces en temps réel. Les auteurs ajoutent une stratégie d'échantillonnage de points guidée par la carte, qui concentre le calcul de recalage sur les zones géométriquement informatives plutôt que d'échantillonner uniformément toute la scène, réduisant le coût de calcul tout en améliorant la robustesse dans les zones dégénérées. Testée sur plusieurs capteurs, plateformes robotiques et environnements, la méthode atteint des performances état de l'art dans les scènes bien contraintes et des gains substantiels là où les méthodes de référence échouent ou divergent. Pour l'industrie robotique, ce travail s'attaque à un point de friction bien connu des intégrateurs de robots mobiles autonomes: la navigation en environnements géométriquement pauvres, couloirs longs, tunnels, entrepôts vides ou zones industrielles répétitives, où les systèmes LIO classiques perdent en précision faute de contraintes suffisantes pour l'alignement des points. Une odométrie plus robuste dans ces conditions réduit directement le risque de dérive de localisation, un enjeu critique pour les AMR en logistique, l'inspection en tunnels ou souterrains, et les interventions en environnements dégradés. Les auteurs signalent également une application dérivée en cartographie d'élévation pour la locomotion, un signal potentiellement pertinent pour les robots à pattes ou humanoïdes devant planifier leurs appuis sur des terrains irréguliers. Ce travail s'inscrit dans la lignée des méthodes LIO basées sur cartes voxelisées, qui cherchent depuis plusieurs années à améliorer la robustesse du SLAM LiDAR-inertiel face aux scènes dégénérées, une limite connue des approches par extraction de primitives géométriques classiques. La publication, une version révisée déposée sur arXiv, ne précise ni date de déploiement ni partenaire industriel; il s'agit à ce stade d'une contribution de recherche académique, dont l'adoption dépendra de tests sur plateformes robotiques réelles au-delà des benchmarks présentés.

RecherchePaper

1 source

2arXiv cs.RO

EllipseLIO : odométrie inertielle LiDAR adaptative par représentation ellipsoïdale

Des chercheurs de l'Université de Chypre (laboratoire v4rl-ucy) ont publié sur arXiv (preprint 2605.21150, mai 2026) un système d'odométrie inertielle LiDAR baptisé EllipseLIO, conçu pour fonctionner en temps réel sans calibration manuelle selon les scenarios. L'approche repose sur une représentation par ellipsoïdes pour le filtrage et le recalage des nuages de points LiDAR, lui permettant de s'adapter automatiquement aux capacités du capteur et à la géométrie de l'environnement. Évalué sur cinq jeux de données couvrant des scénarios variés et difficiles (environnements intérieurs/extérieurs, capteurs hétérogènes), EllipseLIO affiche une erreur d'odométrie inférieure de 38 % en moyenne par rapport à la deuxième meilleure approche testée. Il est également le seul système parmi tous les concurrents évalués à ne diverger dans aucune expérience. Le code sera publié en open source à l'adresse github.com/v4rl-ucy/ellipselio. La portée pratique de ce résultat est significative pour les intégrateurs de robots mobiles autonomes opérant en environnements GPS-dégradés ou GPS-absents (entrepôts, mines, bâtiments industriels, espaces souterrains). Le verrou actuel de la LIO est précisément la nécessité de re-tuner les paramètres à chaque changement de plateforme ou de site, ce qui freine le déploiement à grande échelle sur des flottes multi-capteurs. EllipseLIO casse ce paradigme en éliminant l'intervention humaine entre scenarios, ce qui est une promesse forte, même si les résultats restent à confirmer hors des cinq datasets retenus. L'absence de divergence sur l'ensemble des expériences est la métrique la plus solide présentée : c'est la robustesse, et non la précision seule, qui conditionne l'exploitabilité industrielle d'un système de localisation. La LIO est un sous-domaine mature de la SLAM (Simultaneous Localization and Mapping), avec des approches de référence comme FAST-LIO2 (Université de Hong Kong), LIO-SAM (MIT), ou encore LOAM. Ces systèmes offrent d'excellentes performances dans leurs conditions nominales mais nécessitent un tuning expert dès que le LiDAR ou l'environnement change. EllipseLIO s'inscrit dans une tendance récente vers des pipelines auto-adaptatifs, parallèlement aux approches d'apprentissage profond pour la localisation (ex. : travaux de Cartographer ou des équipes DeepMind/Google sur la localisation neuronale). Il convient de noter qu'EllipseLIO est pour l'instant un preprint non encore soumis à peer review, et que les benchmarks retenus conditionnent fortement les conclusions : une validation indépendante sur des datasets publics standards (MulRan, Hilti, KITTI-360) sera nécessaire pour consolider les affirmations. La mise en open source annoncée permettra à la communauté de reproduire et d'étendre ces évaluations.

UEL'Université de Chypre (institution UE) porte cette avancée en localisation autonome adaptative, susceptible de bénéficier aux intégrateurs européens de robots mobiles en environnements GPS-dégradés dès la mise en open source du code.

RecherchePaper

1 source

3arXiv cs.RO

MM-Nav : un modèle VLA multi-vues pour la navigation visuelle robuste par apprentissage multi-expert

Des chercheurs ont publié MM-Nav (arXiv:2510.03142v2), un modèle de navigation visuelle de type Vision-Language-Action (VLA) capable d'exploiter des observations omnidirectionnelles à 360 degrés pour piloter un robot mobile sans recours à des capteurs de profondeur explicites comme le LiDAR. L'architecture repose sur des modèles de langage et des fondations visuelles pré-entraînés, auxquels s'ajoutent trois experts par renforcement (RL) entraînés séparément avec accès privilégié à l'information de profondeur dans des environnements synthétiques conçus pour trois compétences distinctes : l'atteinte de cible, le passage dans des espaces contraints (squeezing), et l'évitement d'obstacles. Les données générées par ces experts alimentent itérativement le modèle élève selon un ratio d'entraînement ajusté dynamiquement en fonction des performances par compétence. Des expériences en environnement réel viennent compléter la validation en simulation. L'intérêt principal de MM-Nav réside dans ce que les auteurs appellent un "effet synergique" : le modèle élève dépasse les performances de chacun de ses enseignants RL pris individuellement, ce qui suggère que la fusion multi-capacités via un VLA n'est pas simplement additive mais crée une généralisation émergente. Pour les intégrateurs robotiques, cela ouvre la voie à des politiques de navigation robustes sans nécessiter de capteurs LiDAR ou de cartes de profondeur explicites, en s'appuyant uniquement sur des caméras RGB omnidirectionnelles. La capacité à transférer une politique apprise en simulation vers le monde réel (sim-to-real) constitue le vrai enjeu ici, et les auteurs affirment l'avoir validé expérimentalement, bien que les détails sur les environnements réels testés restent limités dans le résumé disponible. MM-Nav s'inscrit dans une dynamique de recherche qui voit les VLA (Vision-Language-Action), popularisés par des travaux comme RT-2 de Google DeepMind ou Pi-0 de Physical Intelligence, s'étendre au-delà de la manipulation pour couvrir la navigation autonome. La différenciation de MM-Nav tient à son approche multi-expert à apprentissage itératif, par opposition aux approches à expert unique ou aux méthodes de distillation statique. Les acteurs concurrents dans ce segment incluent notamment des groupes académiques travaillant sur NavVLP ou ViNT, ainsi que des startups comme Skild AI qui ciblent des politiques de locomotion généralisées. Ce travail en est au stade de preprint arXiv (version 2, mise à jour d'un article d'octobre 2025) : il n'y a pas de déploiement industriel annoncé, et les résultats doivent être interprétés comme une validation académique en attente de revue par les pairs.

RechercheOpinion

1 source

4arXiv cs.RO

Détection structurelle en temps réel pour la navigation intérieure par LiDAR 3D avec images en vue aérienne

Des chercheurs ont publié sur arXiv (arXiv:2603.19830v2) un pipeline de perception léger capable de détecter en temps réel les structures d'un environnement intérieur à partir de données LiDAR 3D, sans recourir à un GPU. Le principe : projeter le nuage de points 3D en images Bird's-Eye-View (BEV) 2D, puis appliquer un détecteur sur cette représentation compressée. L'équipe a comparé quatre approches de détection de structures (murs, couloirs, portes) : la transformée de Hough, RANSAC, LSD (Line Segment Detector) et un réseau YOLO-OBB (Oriented Bounding Box). Les expériences ont été conduites sur une plateforme robotique mobile standard équipée d'un single-board computer (SBC) à faible consommation. Résultat : YOLO-OBB est la seule méthode à satisfaire la contrainte temps réel de 10 Hz en bout de chaîne, là où RANSAC dépasse les budgets de latence et LSD génère une fragmentation excessive de segments qui sature le système. Un module de fusion spatiotemporelle stabilise les détections entre frames consécutives. L'intérêt opérationnel est direct pour les intégrateurs de robots mobiles autonomes (AMR) fonctionnant sur du matériel embarqué standard, typiquement des SBC ARM sans accélérateur dédié. Démontrer qu'un détecteur basé YOLO-OBB tient 10 Hz sur ce type de plateforme réduit le coût matériel des solutions de cartographie et navigation indoor, un verrou persistant dans le déploiement à grande échelle d'AMR en entrepôt ou en milieu hospitalier. L'approche BEV contourne également la complexité computationnelle des traitements de nuages de points 3D complets (méthodes de type PointNet, VoxelNet), qui restent prohibitifs hors GPU. La mise à disposition du code source et des modèles pré-entraînés facilite la reproductibilité et l'adaptation industrielle. Ce travail s'inscrit dans un courant de recherche actif visant à rendre la perception robotique robuste accessibles aux plateformes contraintes en ressources, en concurrence directe avec des approches comme les architectures 2D range-image ou les méthodes pillars (PointPillars). Sur le plan de la navigation indoor, il complète des stacks SLAM existants (Cartographer, RTAB-Map) en ajoutant une couche de détection structurelle explicite, utile pour la planification de trajectoires en espaces semi-structurés. Les prochaines étapes logiques incluent la validation sur des scénarios plus denses (open space vs couloirs étroits), ainsi que l'intégration dans des boucles de localisation et cartographie continues, où la stabilité temporelle du module de fusion sera mise à l'épreuve à plus grande échelle.

RecherchePaper

1 source