RecherchearXiv cs.RO 29 mai 2026

Synchronisation SE(3) par double quaternion avec garanties de récupération

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs propose sur arXiv (2602.00324v2) un algorithme de synchronisation SE(3) formulé directement sur les quaternions duaux. Le problème central - récupérer des poses absolues (position et orientation 3D) à partir de transformations relatives bruitées entre scans ou capteurs - est au coeur du SLAM, de la calibration multi-caméra et de la reconstruction 3D. Les méthodes classiques reposent sur des heuristiques multi-étapes sans garanties théoriques. Les auteurs encodent rotation et translation dans un unique objet mathématique (le quaternion dual unitaire) et construisent un algorithme en deux étapes : d'abord un initialisateur spectral par méthode des puissances sur une matrice hermitienne à coefficients quaternioniques duaux, suivi d'une méthode de puissance généralisée sur quaternions duaux (DQGPM) avec projection géométrique à chaque itération pour garantir la faisabilité. Les tests sur benchmarks synthétiques et sur des enregistrements réels de nuages de points multi-scans montrent une précision et une efficacité supérieures aux méthodes matricielles de référence.

L'apport principal est théorique : les auteurs établissent des bornes d'erreur formelles pour l'estimateur spectral et prouvent que DQGPM converge en nombre fini d'itérations avec une contraction linéaire jusqu'à un seuil dépendant explicitement du niveau de bruit. C'est une rareté dans ce domaine, où la convergence est généralement seulement empirique. Pour les ingénieurs déployant des systèmes SLAM ou LiDAR multi-scans en contexte industriel, cela signifie un pipeline dont le comportement est borné et potentiellement certifiable - condition préalable à l'homologation de robots mobiles en environnement critique. La représentation unifiée rotation-translation élimine par ailleurs les erreurs d'accumulation liées à la séparation des deux composantes dans les formulations matricielles classiques.

La synchronisation sur SE(3) est un problème formalisé depuis plusieurs décennies, adjacent aux travaux en rotation averaging (Hartley, Govindu) et en synchronisation SO(3) (Carlone, Singer). Les méthodes concurrentes dominantes - relaxations SDP, descente de gradient riemannienne, initialisation chordale - restent toutes à base matricielle. Les quaternions duaux sont établis en cinématique des manipulateurs depuis les années 1990, mais rarement exploités en estimation robuste à grande échelle. Ce travail s'inscrit dans un mouvement récent visant à doter les algorithmes de perception robotique de fondements formels, prérequis à leur certification dans des applications critiques (autonomie industrielle, espace). La validation sur des benchmarks SLAM temps réel à grande échelle tels que KITTI ou Hilti représente l'étape suivante naturelle.

Impact France/UE

Les garanties formelles de convergence sur SE(3) pourraient constituer un prérequis à la certification de systèmes SLAM embarqués dans des robots mobiles soumis aux futures normes européennes de sécurité, mais aucun acteur FR/UE n'est directement impliqué.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Collaboration humain-robot sécurisée par vision avec garanties de robustesse

Des chercheurs ont publié sur arXiv (arXiv:2504.15221) un framework de collaboration humain-robot (HRC) fondé sur la vision par ordinateur, capable de certifier formellement la sécurité des trajectoires en présence d'incertitude. Le système combine estimation de pose humaine en temps réel, prédiction de mouvement et prédiction conforme, une méthode statistique qui garantit, avec un niveau de confiance paramétrable, que les ensembles de prédiction couvrent la trajectoire réelle avec une probabilité donnée. Le pipeline intègre également une détection de distribution hors domaine (OOD) pour identifier les configurations corporelles non vues à l'entraînement, réduisant les faux positifs de certitude. Les expériences couvrent à la fois des séquences de mouvement enregistrées et un scénario de collaboration réelle bras robotique/opérateur humain. L'apport principal est de sortir du compromis classique entre performance et garanties formelles : la plupart des systèmes de sécurité HRC reposent soit sur des marges de sécurité fixes trop conservatrices, soit sur des prédictions neuronales sans borne de confiance vérifiable. Ici, les ensembles de prédiction conformes fournissent une couverture statistique valide indépendamment de la distribution des données, ce qui permet d'intégrer le module dans des architectures de contrôle certifiables (CBF, MPC robuste). C'est un pas concret vers des robots industriels capables de partager l'espace de travail humain sans cage, avec des garanties auditables. Ce travail s'inscrit dans un axe de recherche actif sur la sécurité formelle en robotique collaborative, aux côtés de travaux sur les Control Barrier Functions et la prédiction d'intention. Les auteurs n'annoncent pas de déploiement industriel ni de partenariat commercial, il s'agit d'une contribution académique, avec validation en laboratoire. La prochaine étape naturelle serait une intégration sur plateforme cobotique standard (UR, KUKA iiwa) dans un environnement manufacturier réel pour évaluer la latence bout-en-bout et la robustesse aux occlusions partielles.

RecherchePaper

1 source

2arXiv cs.RO

ReGIL : apprentissage par imitation guidé par récupération à partir d'une seule démonstration

Des chercheurs présentent ReGIL (Retrieval-Guided Imitation Learning), un framework d'apprentissage par imitation capable d'entraîner un robot manipulateur à partir d'une seule démonstration. La méthode traite cette démonstration unique comme une mémoire externe statique, interrogée en continu durant l'entraînement pour guider simultanément l'exploration, générer un buffer de régularisation et construire les récompenses. Le calcul de récompense repose sur un alignement temporel local entre la trajectoire courante et le segment récupéré, fournissant un feedback pas-à-pas plutôt qu'un signal binaire succès/échec. Évalué sur les benchmarks LIBERO et Meta-World, ReGIL surpasse les baselines antérieures en taux de réussite et en efficacité d'entraînement. Sur robot réel, avec une seule démonstration et moins d'une heure d'entraînement en ligne, le système atteint plus de 75 % de taux de réussite sur trois tâches de manipulation avec randomisation à la fois de la pose initiale du robot et de la position cible. Ces résultats sont issus d'un preprint arXiv (2606.09381) et n'ont pas encore été soumis à revue par les pairs. Le principal défi que ReGIL cherche à résoudre est connu sous le nom de "compounding error" : en imitation learning classique (behavior cloning), les petites déviations par rapport à la trajectoire démontrée s'accumulent et mènent rapidement à l'échec, ce qui oblige généralement à collecter des centaines, voire des milliers de démonstrations. Ramener ce seuil à une seule démonstration plus moins d'une heure d'interaction en ligne représente un gain opérationnel significatif pour le déploiement industriel, où la collecte de données est coûteuse. Le taux de 75 % obtenu avec randomisation de pose et de cible est un indicateur de robustesse plus solide qu'une démonstration en conditions fixes, même si l'absence de détails sur les tâches spécifiques et la complexité des scènes limite l'interprétation. L'apprentissage par imitation à faible nombre de démonstrations est un axe de recherche très actif, concurrencé notamment par les modèles VLA (Vision-Language-Action) comme pi-0 de Physical Intelligence ou les politiques de diffusion (Diffusion Policy, ACT). Ces approches misent sur des grandes quantités de données préentraînées pour compenser la rareté des démos spécifiques à une tâche, là où ReGIL propose une alternative radicalement data-light. Le benchmark LIBERO est devenu un standard de fait pour comparer ces méthodes en simulation, et Meta-World permet d'évaluer la généralisation multi-tâches. La prochaine étape logique serait une validation sur des tâches de manipulation plus complexes et une publication dans une conférence de robotique (ICRA, CoRL, RSS) pour valider les claims de manière indépendante.

RecherchePaper

1 source

3arXiv cs.RO

Politiques de récupération sensibles aux différences pour l'apprentissage par imitation

Une équipe du Weird Lab de l'Université de Washington publie sur arXiv (arXiv:2606.09758, juin 2026) une méthode appelée DARP (Difference-Aware Retrieval Policies for Imitation Learning), une approche semi-paramétrique d'apprentissage par imitation. Le principe central : plutôt que d'apprendre un mapping global état-action via un réseau de neurones pur (behavior cloning standard), DARP entraîne un modèle à prédire des actions en s'appuyant sur les k plus proches voisins (k-NN) extraits des démonstrations expertes, leurs actions associées, et les vecteurs de distance relative entre les états voisins et l'état requête courant. En reformulant le problème d'imitation en termes de structure de voisinage local plutôt que de mappings directs, la méthode revendique des gains de performance de 15 à 46 % sur behavior cloning standard, mesurés sur des benchmarks de contrôle continu et de manipulation robotique, y compris avec des représentations visuelles haute dimension. L'amplitude de cette fourchette suggère des variations importantes selon les tâches et les domaines évalués. L'intérêt concret de DARP réside dans sa capacité à atténuer le problème de "compounding errors" : lors du déploiement, un agent entraîné par behavior cloning accumule des erreurs en rencontrant des états hors distribution, dégradant rapidement les performances. En réutilisant les données d'entraînement au moment de l'inférence, DARP introduit une forme de mémoire épisodique sans nécessiter de collecte de données supplémentaires, de feedback expert en ligne, ni de connaissance spécifique à la tâche. C'est là la distinction clé vis-à-vis de méthodes comme DAgger (Ross et Bagnell, 2011), qui résolvent la distribution shift mais exigent des requêtes à l'expert pendant l'entraînement, une contrainte souvent rédhibitoire en robotique industrielle réelle. Le behavior cloning reste une méthode de référence pour son absence de contraintes opérationnelles, mais sa fragilité face à la distribution shift en limite la portée pour des déploiements à grande échelle. DARP s'inscrit dans un courant de méthodes semi-paramétriques qui connaît un regain d'intérêt avec la montée des politiques génératives : l'idée de conserver explicitement une mémoire des démonstrations plutôt que de tout comprimer dans des poids de réseau est cohérente avec les architectures hybrides actuelles, comme les VLA Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA). Les résultats sur représentations visuelles haute dimension ouvrent la voie à des applications sur des manipulateurs avec vision RGB, domaine où les approches purement paramétriques montrent encore des limites significatives. Le code et les démonstrations sont disponibles publiquement via le site des auteurs.

RecherchePaper

1 source

4arXiv cs.RO

Planification de mouvements sûre sous perturbations inconnues, avec garanties formelles

Des chercheurs ont publié sur arXiv (arXiv:2605.26625) un algorithme de planification de mouvement par échantillonnage qui garantit formellement la sûreté de systèmes robotiques soumis à des perturbations aléatoires dont la distribution est inconnue. L'approche s'applique aux robots à dynamique linéaire ou linéarisable évoluant dans des environnements encombrés avec des obstacles de forme arbitraire, sous contraintes d'état et de commande. La sûreté est formulée comme des chance-constraints (contraintes probabilistes), et l'algorithme apprend depuis des trajectoires observées un "tube d'ambiguïté de Wasserstein", une séquence d'ensembles d'ambiguïté qui contient, avec haute confiance, la distribution d'état réelle du système. Ce tube est ensuite intégré dans un arbre de planification probabilistiquement complet. Les auteurs introduisent également un vérificateur de validité basé sur les bandits multi-bras qui accélère significativement les performances empiriques sans compromettre la complétude. Les cas d'étude montrent que l'algorithme trouve des trajectoires valides dans des environnements denses sous des seuils de sécurité stricts, surpassant les méthodes de référence actuelles. L'enjeu pratique est considérable pour les intégrateurs de robots industriels et les équipes d'autonomie : la plupart des planificateurs de mouvement existants supposent soit une distribution de bruit connue (hypothèse souvent irréaliste), soit ignorent les perturbations stochastiques au profit de marges de sécurité conservatives et figées. Cette méthode data-driven contourne les deux écueils en apprenant directement l'incertitude depuis des données de trajectoires, sans hypothèse paramétrique forte. La réduction du conservatisme via des tubes d'ambiguïté de faible dimension, plusieurs tubes en basse dimension plutôt qu'un seul en haute dimension, améliore la scalabilité, un obstacle classique des approches distributionally robust appliquées à la robotique. C'est un pas concret vers des robots opérant en production dans des environnements non contrôlés, sans recalibration systématique du modèle de bruit. La planification de mouvement sûre sous incertitude est un champ actif depuis deux décennies, structuré autour de méthodes comme RRT/RRT*, les MPC robustes et les approches de tube invariant. L'utilisation de la distance de Wasserstein pour construire des ensembles d'ambiguïté s'inscrit dans le courant des méthodes distributionally robust optimization (DRO), popularisées en contrôle ces cinq dernières années notamment par les groupes de ETH Zurich, Caltech et MIT. Ce preprint n'est pas encore évalué par les pairs. Les prochaines étapes attendues incluent une validation sur hardware réel (les cas d'étude présentés restent en simulation) et une extension aux dynamiques non linéaires, deux conditions nécessaires avant toute intégration dans des pipelines d'autonomie industrielle.

RecherchePaper

1 source