RecherchearXiv cs.RO1h

TACO : un cadre de test et vérification pour l'optimisation robuste de graphe de poses

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié TACO (Test And Check Optimization), un framework open-source dédié à la robustification de l'optimisation de graphes de poses (PGO), pierre angulaire des systèmes SLAM (Simultaneous Localization and Mapping). Présenté dans un preprint arXiv (2606.29851), le système adresse un problème concret : les mesures aberrantes (outliers) issues d'associations incorrectes de reconnaissance de lieux, phénomène classique en environnements répétitifs (couloirs, entrepôts). TACO repose sur deux composants complémentaires. Le premier, IPC (Incremental Probabilistic Consensus), évalue en ligne la cohérence de chaque fermeture de boucle entrant dans le graphe. Le second, Switchable Outlier Sanitization, s'appuie sur les Switchable Constraints existantes pour purger périodiquement les mesures incohérentes qu'IPC aurait à tort intégrées. Sur des benchmarks 2D et 3D, TACO atteint un taux de succès supérieur à 90 % en 2D et 83 % en 3D, même avec un taux d'outliers pouvant atteindre 50 %, avec des temps de convergence moyens de 45 ms en 2D et 100 ms en 3D.

Ces performances positionnent TACO comme une alternative crédible aux méthodes offline état de l'art, tout en restant déployable en temps réel, ce qui est rare dans ce segment. Pour les intégrateurs de robots mobiles (AMR, AGV) et les équipes SLAM embarqué, c'est un signal important : un pipeline PGO robuste aux outliers avec une latence inférieure à 100 ms ouvre la voie à des localisations fiables dans des environnements industriels mal contraints, sans nécessiter de post-traitement offline coûteux. Le fait que la robustesse soit atteinte sans modélisation explicite inlier/outlier simplifie aussi le tuning en production.

Le PGO robuste est un champ actif depuis plus d'une décennie, avec des approches comme DCS (Dynamic Covariance Scaling), les Switchable Constraints de Sünderhauf, ou encore les méthodes basées M-estimateurs. TACO s'inscrit dans cette lignée en combinant une évaluation incrémentale probabiliste à une sanitisation rétrospective, là où la plupart des méthodes temps réel font l'un ou l'autre. Les concurrents directs incluent ROBIN, Graduated Non-Convexity (GNC) et ORB-SLAM3 pour le SLAM visuel 3D. Le code est publié en open source, ce qui facilitera l'intégration dans des stacks ROS existants et permettra à la communauté de valider les performances sur des jeux de données propriétaires.

Impact France/UE

Framework open-source intégrable dans les stacks ROS des intégrateurs AMR/AGV européens, sans impact institutionnel direct sur la France/UE.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

VeriGraph : graphes de scène pour la vérification de plans de robots

Des chercheurs ont publié VeriGraph (arXiv:2411.10446v3), un système de planification robotique qui combine des modèles vision-langage (VLM) avec un mécanisme de vérification formelle des actions. Le principe central repose sur l'utilisation de graphes de scène comme représentation intermédiaire : à partir d'images en entrée, le système construit un graphe capturant les objets présents et leurs relations spatiales, puis s'en sert pour valider et corriger en boucle les séquences d'actions générées par un planificateur LLM. Les gains rapportés sur des tâches de manipulation sont significatifs : +58 % de taux de complétion sur les tâches guidées par langage, +56 % sur des puzzles tangram, et +30 % sur les tâches guidées par image, par rapport aux méthodes de référence testées. Ce résultat pointe un problème structurel bien documenté dans le domaine : les VLM et LLM génèrent des plans plausibles en surface mais géométriquement ou physiquement incorrects, un objet posé sur une surface inexistante, une saisie dans un ordre impossible. VeriGraph traite ce gap en introduisant une couche de vérification symbolique ancrée dans l'état réel de la scène, ce qui réduit les hallucinations de planification sans nécessiter de fine-tuning du modèle sous-jacent. Pour les intégrateurs industriels et les équipes robotique, cela suggère une voie pragmatique : greffer un vérificateur léger sur des LLM généralistes plutôt que de tout réentraîner, ce qui abaisse potentiellement le coût d'adaptation à de nouveaux environnements. VeriGraph s'inscrit dans un courant de recherche actif autour des architectures hybrides neuro-symboliques pour la robotique, où des travaux comme SayPlan (Rana et al.), LLMTAMP ou les approches PDDL-guided cherchent tous à contraindre la génération de plans par des vérificateurs formels ou géométriques. La nouveauté ici réside dans l'usage du graphe de scène comme interface universelle entre perception et planification. Les auteurs publient le code sur un site dédié, ce qui facilite la reproductibilité, mais les expériences restent en environnement simulé ou de laboratoire contrôlé, aucun déploiement en conditions industrielles réelles n'est mentionné à ce stade.

RechercheOpinion

1 source

2arXiv cs.RO

Système LiDAR-SLAM décentralisé à optimalité certifiée pour l'optimisation de graphe de poses

Des chercheurs ont publié sur arXiv (référence 2605.25051v1) un système de LiDAR-SLAM décentralisé conçu pour les missions multi-robots collaboratives, intégrant pour la première fois un backend d'optimisation de graphe de poses (PGO) certifié optimal. Le coeur de l'approche repose sur l'algorithme de descente de coordonnées par blocs riemanniens (RBCD), qui garantit mathématiquement la convergence vers une solution globalement cohérente sans nécessiter d'estimation initiale précise. Contrairement aux méthodes existantes qui s'arrêtent à des optima locaux ou n'alignent les repères qu'une seule fois en début de mission, ce système maintient une cohérence globale de trajectoire tout au long de la mission. Les expériences rapportées montrent une amélioration de la RMSE de trajectoire allant jusqu'à 48,9 % par rapport à DiSCo-SLAM, référence actuelle pour les architectures décentralisées. L'enjeu est substantiel pour les intégrateurs de flottes robotiques autonomes. Le SLAM multi-robot est un pilier des missions en environnements sans GPS : entrepôts, mines souterraines, bâtiments industriels, zones sinistrées. Le problème central est la cohérence globale : quand plusieurs robots fusionnent leurs cartes locales construites indépendamment, les dérives cumulées et les ambiguïtés géométriques (couloirs symétriques, espaces ouverts) conduisent souvent à des incohérences non détectées. Que l'optimisation soit "certifiablement optimale" signifie qu'on peut prouver formellement l'optimalité de la solution, ce que les approches à recherche locale comme iSAM2 ou DCS ne peuvent pas garantir. Pour un COO déployant des flottes d'AMR en logistique ou un intégrateur en robotique d'inspection, c'est une promesse de robustesse qualitativement différente des solutions actuelles. Le SLAM décentralisé multi-robot est un domaine de recherche actif depuis une décennie. DiSCo-SLAM, Kimera-Multi et LAMP 2.0 représentent les références récentes, mais tous s'appuient sur des heuristiques d'optimisation locale. L'introduction du RBCD dans ce contexte transpose des techniques issues de l'optimisation riemannienne vers la robotique de terrain. À ce stade, le travail reste un preprint expérimental sans déploiement industriel annoncé ni partenaire commercial identifié. Les prochaines étapes naturelles seraient une validation sur des jeux de données publics de référence comme MulRan ou KITTI, et des tests en conditions réelles avec des robots hétérogènes.

RecherchePaper

1 source

3arXiv cs.RO

Optimisation riemannienne décentralisée sur graphe de poses pour le SLAM multi-robots basé objets

Des chercheurs publient sur arXiv (réf. 2606.24489) un cadre d'optimisation entièrement décentralisé pour le SLAM multi-robots basé sur des objets. Le PGO (Pose Graph Optimization) est le composant d'estimation d'état central des flottes robotiques en réseau : chaque agent doit estimer simultanément sa propre trajectoire et les poses d'objets persistants observés par plusieurs robots. L'algorithme proposé travaille sur la variété SE(d) via l'optimisation riemannienne, couplé à un mécanisme de consensus pour découpler les estimations conjointes. Il intègre également un schéma Newton approché distribué exploitant des informations de second ordre locales afin d'améliorer la convergence sous budgets de communication limités. Les évaluations couvrent des benchmarks publics, des simulations à grande échelle et des expériences multi-robots réelles, avec des gains annoncés en précision, temps d'exécution et passage à l'échelle. Le verrou adressé est directement pertinent en déploiement industriel : les solutions décentralisées existantes supposent que le graphe de communication coïncide avec la topologie physique d'interaction des robots, une hypothèse irréaliste lorsque la communication est intermittente, éparse ou variable dans le temps. En découplant ces deux topologies, le framework devient applicable aux entrepôts avec AMR, aux flottes de drones ou aux convois de véhicules autonomes. L'apport théorique -- convergence prouvée vers des points stationnaires riemanniens de premier ordre et analyse du nombre de conditionnement local justifiant l'avantage du second ordre sur la descente de gradient pure -- distingue ce travail des approches heuristiques. La réduction du nombre d'itérations et de la charge de communication sans perte de précision est le bénéfice opérationnel central, même si la distance entre preuves formelles et performances terrain reste un écart classique dans le domaine. Le SLAM multi-robots décentralisé est un champ actif depuis une décennie, avec des contributions majeures comme SE-Sync (Rosen et al., Brown University), KIMERA-Multi (MIT SPARK Lab) ou DOOR-SLAM. Cette méthode s'inscrit dans leur continuité en ajoutant la gestion explicite des objets partagés entre agents et la robustesse aux pannes de communication. Ce préprint arXiv n'a pas encore été évalué par les pairs et ne correspond à aucun produit ni déploiement commercial annoncé : c'est une contribution algorithmique pure. Les suites naturelles seraient une soumission à ICRA 2027 ou IROS, et des tests de validation sur des flottes denses en environnement réel non contrôlé. Aucun acteur français ou européen n'est mentionné dans les travaux.

RecherchePaper

1 source

4arXiv cs.RO

Sélection et planification simultanées des contacts pour la manipulation riche en contacts par optimisation en cascade

Des chercheurs ont publié sur arXiv (référence 2605.27972) un cadre d'optimisation en cascade baptisé SCSP, pour Simultaneous Contact Selection and Planning, dédié à la manipulation robotique en contact riche. Ce type de manipulation regroupe les tâches où le bras doit gérer plusieurs points de contact dynamiques : pivotement d'objet, manipulation en main, assemblage serré. Le système repose sur deux modules séquentiels : CSO (Contact Selection Optimization), qui détermine automatiquement les localisations de contact optimales sur l'objet cible, et CPO (Contact Planning Optimization), qui génère ensuite les trajectoires de manipulation correspondantes en temps réel pour des bras redondants à sept degrés de liberté ou plus. Les auteurs valident l'approche en simulation et sur robot physique, sur des tâches décrites comme complexes, sans que l'abstract ne fournisse de métriques de temps de cycle ou de taux de succès chiffrés. Le verrou que SCSP prétend lever est structurant pour la manipulation autonome : la quasi-totalité des méthodes contact-implicit existantes suppose que la séquence de points de contact est définie à l'avance par l'opérateur. Le robot optimise la trajectoire, pas l'endroit où il entre en contact. CSO contourne les deux obstacles qui rendaient la sélection active difficile, à savoir la complémentarité dans la dynamique de contact et les gradients parcimonieux, en substituant un modèle de contact approché et différentiable au modèle physique discontinu, couplé à une optimisation discrète-continue. CPO exploite ensuite ces localisations comme prior pour planifier en temps réel. Si le comportement se généralise hors simulation, le framework permettrait d'aborder des tâches de manipulation substantiellement plus complexes sans paramétrage manuel des modes de contact, ce qui est aujourd'hui l'un des goulots d'étranglement principaux en intégration industrielle. Le champ de la manipulation en contact riche est partagé entre deux grandes familles : l'optimisation classique (contact-implicit trajectory optimization, MPC) et l'apprentissage (VLA, diffusion policies), portées notamment par Physical Intelligence avec Pi-0, Covariant et Figure AI. SCSP s'inscrit dans la ligne optimisation, plus interprétable et potentiellement plus robuste hors distribution que les approches end-to-end. L'identité institutionnelle des auteurs n'apparaît pas dans l'abstract arXiv, ce qui complique l'évaluation de la maturité et du soutien financier derrière le travail. Les démonstrations vidéo disponibles sur le site projet constitueront le vrai test de crédibilité avant tout positionnement industriel.

RecherchePaper

1 source