Aller au contenu principal
Caspar : un accélérateur CUDA pour la programmation symbolique avec réordonnancement adaptatif
RecherchearXiv cs.RO1h

Caspar : un accélérateur CUDA pour la programmation symbolique avec réordonnancement adaptatif

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a présenté Caspar (CUDA Accelerator for Symbolic Programming with Adaptive Reordering), une bibliothèque open source qui génère automatiquement des noyaux CUDA optimisés à partir d'expressions symboliques définies en Python, sans que l'utilisateur n'écrive une seule ligne de C++. Construite sur SymForce, elle prend en charge les opérations sur les groupes de Lie et la différentiation symbolique automatique : l'utilisateur formule ses fonctions résiduelles de façon expressive, et Caspar compile l'ensemble en code GPU haute performance. Pour valider l'approche, l'équipe a mesuré les performances sur le jeu de données BAL (Bundle Adjustment in the Large), référence académique standard pour les problèmes d'ajustement de faisceaux en vision 3D, en comparant Caspar aux meilleurs solveurs disponibles.

Sur ce benchmark, Caspar s'avère 5 à 20 fois plus rapide que la meilleure alternative existante, avec une empreinte mémoire moindre et une précision comparable. C'est un résultat notable pour toute application robotique reposant sur l'optimisation non linéaire temps réel : SLAM (Simultaneous Localization and Mapping), calibration de capteurs multiples, planification de trajectoires, ou reconstruction 3D embarquée. En abstrayant la complexité CUDA derrière une interface Python symbolique, Caspar abaisse substantiellement la barrière à l'accélération GPU dans les pipelines robotiques industriels, un domaine où la maîtrise du CUDA reste rare et coûteuse. Le résultat illustre qu'une approche de compilation symbolique automatisée peut rivaliser, voire dépasser, des implémentations GPU écrites à la main par des experts.

SymForce a été initialement développé chez Skydio, fabricant américain de drones autonomes, avant d'être publié en open source. Dans l'espace des solveurs non linéaires, Caspar entre en concurrence directe avec Ceres Solver (Google), g2o et GTSAM, qui dominent les applications de SLAM et de robotique. La bibliothèque est disponible librement dans le dépôt GitHub symforce-org/symforce ; la publication présentée ici est un preprint arXiv, non encore évalué par les pairs. Les benchmarks portent exclusivement sur des jeux de données académiques standards : les gains annoncés restent à confirmer sur des cas d'usage robotiques temps réel embarqués, où les contraintes de latence et de mémoire GPU sont sensiblement plus sévères.

Dans nos dossiers

À lire aussi

Exploitation de la parcimonie chordale pour une estimation globalement optimale avec des graphes de facteurs
1arXiv cs.RO 

Exploitation de la parcimonie chordale pour une estimation globalement optimale avec des graphes de facteurs

Une équipe de chercheurs associée au Borg Lab (Georgia Tech) a publié fin mai 2026 un préprint arXiv (2605.30617) présentant une méthode pour rendre l'estimation d'état globalement optimale dans les graphes de facteurs, sans effort de formulation manuelle. Le travail s'intègre directement à GTSAM, la bibliothèque de référence pour le SLAM et la navigation, et repose sur deux contributions : une procédure automatisée de construction de relaxations SDP (semi-definite programming) convexes pour tout graphe de facteurs utilisant les types de variables et de facteurs courants, et l'exploitation de la structure creuse chorale native de l'arbre de Bayes (Bayes tree) de GTSAM pour décomposer le problème SDP. Les deux cas d'usage évalués sont un problème de SLAM 3D par pose-graph en anneau et un problème de localisation 2D en chaîne, sur lesquels le nouvel estimateur démontre une meilleure scalabilité que les solveurs locaux standards. Le code est disponible sur le dépôt borglab/gtsam. L'enjeu est directement lié à la sécurité des systèmes robotiques : les solveurs locaux embarqués dans GTSAM ou g2o peuvent converger vers de mauvais minima locaux, ce qui dans un contexte de navigation autonome ou de perception industrielle représente un risque réel. Les approches par relaxations convexes garantissent l'optimalité globale ou permettent de certifier la solution, mais elles étaient jusqu'ici réservées à des cas formulés manuellement par des spécialistes, et pénalisées par le coût de résolution d'un SDP de grande taille. En automatisant la construction de la relaxation et en exploitant la sparsité du problème, les auteurs réduisent substantiellement ce surcoût computationnel, rendant l'approche crédible pour des applications embarquées ou temps-réel. Les graphes de facteurs sont l'outil dominant en estimation robotique depuis les travaux séminaux de Dellaert et Kaess (iSAM, iSAM2) au début des années 2010, et GTSAM en est l'implémentation la plus utilisée en recherche. Les relaxations SDP pour le SLAM ont été explorées depuis une dizaine d'années, notamment par Rosen et al. avec SE-Sync (2019), qui ciblait spécifiquement la synchronisation de poses. Ce nouveau travail généralise l'approche à des graphes de facteurs arbitraires, ce qui constitue un pas vers une intégration praticable dans des pipelines SLAM existants. Il s'agit d'un préprint non encore soumis à révision par les pairs, et les gains de performance annoncés restent à confirmer sur des benchmarks plus complexes ou des architectures embarquées contraintes.

RecherchePaper
1 source
ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU
2arXiv cs.RO 

ScheduleStream : planification temporelle avec échantillonneurs pour l'ordonnancement et la planification de tâches et mouvements multi-bras accélérée par GPU

Une équipe de chercheurs présente ScheduleStream (arXiv:2511.04758v2), un cadre généraliste de planification et d'ordonnancement pour robots bi-manuels et humanoïdes, conçu pour coordonner plusieurs bras en parallèle. Contrairement aux algorithmes TAMP (Task and Motion Planning) classiques, qui produisent des plans séquentiels où un seul bras se déplace à la fois, ScheduleStream modélise la dynamique temporelle via des hybrid durative actions, des actions pouvant démarrer de façon asynchrone et persister pendant une durée fonction de leurs paramètres. Cette architecture permet d'orchestrer des mouvements simultanés sur plusieurs membres, réduisant le temps de cycle global. Le système intègre une accélération GPU au sein même des échantillonneurs de trajectoires (samplers), et repose sur des algorithmes indépendants du domaine d'application. Les auteurs le valident en simulation ainsi que sur plusieurs tâches bi-manuelles réelles, dont les démonstrations sont accessibles sur schedulestream.github.io. Aucun chiffre précis de gain de temps ni de configuration matérielle (DOF, payload) n'est fourni dans l'abstract : des éléments à vérifier dans le papier complet. Le verrou adressé est structurel : l'espace d'action hybride discret-continu d'un robot multi-bras croît de façon combinatoire, rendant la planification computationnellement prohibitive dès qu'on autorise le parallélisme. En produisant des schedules plutôt que de simples séquences, ScheduleStream ouvre la voie à des cellules robotiques capables d'exécuter des sous-tâches simultanément, saisie d'un côté et assemblage de l'autre, ce qui est précisément le cas d'usage clé pour les intégrateurs cherchant à justifier un humanoïde bi-manuel (Figure 03, Optimus Gen 3, Atlas) en environnement industriel. L'accélération GPU dans le sampler est notable dans un domaine historiquement dominé par des planificateurs CPU-bound, et suggère une voie vers des temps de planification compatibles avec des cadences réelles. Le champ TAMP multi-bras s'est structuré autour de travaux comme PDDLStream (Garrett et al., MIT CSAIL), qui a introduit l'échantillonnage continu dans TAMP, mais sans gestion native du parallélisme temporel. ScheduleStream prolonge cette lignée en ajoutant la dimension asynchrone, un problème traité par ailleurs dans la communauté PDDL+ via des planificateurs temporels comme OPTIC ou POPF. Sur le terrain applicatif, les approches concurrentes incluent les politiques d'imitation comme ACT ou Diffusion Policy, qui contournent la planification symbolique au prix d'une moindre généralisabilité, et des frameworks comme MoveIt Task Constructor sous ROS2. La prochaine étape naturelle serait une validation sur des cellules de production réelles avec des métriques de cycle time documentées, ainsi qu'une publication du code source, non encore disponible à la date d'annonce.

RecherchePaper
1 source
RED : ordonnancement adaptatif de DAG en temps réel pour l'inférence robotique en environnements dynamiques
3arXiv cs.RO 

RED : ordonnancement adaptatif de DAG en temps réel pour l'inférence robotique en environnements dynamiques

Des chercheurs ont publié le 26 mai 2026 sur arXiv (identifiant 2605.24044) une architecture de planification temps-réel baptisée RED, pour Robotic Environmental Dynamics scheduling. L'objectif : permettre à des robots déployés dans des environnements dynamiques d'exécuter simultanément plusieurs réseaux de neurones profonds sur du matériel embarqué contraint, sans violer les contraintes de timing. Le système a été implémenté et évalué sur deux familles de plateformes : la gamme NVIDIA Jetson (standard de facto du bord embarqué robotique) et des MacBook équipés de puces Apple M-series. Les charges de travail testées couvrent des scénarios de navigation autonome représentatifs de l'inférence robotique réelle. L'architecture repose sur un ordonnanceur sensible aux échéances qui attribue des sous-échéances intermédiaires aux tâches organisées en graphes orientés acycliques (DAG), permettant de gérer des graphes de calcul évolutifs et des inférences asynchrones induites par des conditions imprévisibles. Le problème visé est concret et sous-estimé en production : lorsqu'un robot perçoit son environnement en temps réel, les tâches d'inférence ne sont pas statiques. De nouveaux objets apparaissent, les relations de précédence entre tâches changent, et la structure globale du calcul évolue à l'échelle de la milliseconde. RED introduit une procédure de raffinement de charge couplée à une reconstruction du graphe pour aligner la structure des MIMONet (réseaux multi-entrées multi-sorties qui mutualisent les poids afin de réduire la pression mémoire) avec les exigences de planifiabilité. Les auteurs annoncent des gains sur les méthodes existantes en débit, respect des échéances, robustesse aux interférences et overhead d'exécution, sans publier de métriques chiffrées dans le résumé, ce qui rend toute évaluation indépendante de l'amplitude réelle des améliorations impossible à ce stade. Ce travail s'inscrit dans un domaine en forte activité : l'inférence embarquée pour la robotique autonome, où l'edge computing doit concilier contraintes temps-réel strictes et workloads d'IA croissants. RED se positionne face aux ordonnanceurs EDF (Earliest Deadline First) classiques et aux executors ROS 2. Il n'y a pas d'annonce de commercialisation associée : il s'agit d'un preprint académique, dont les suites dépendront du peer-review et d'éventuelles collaborations industrielles. Les équipes travaillant sur des architectures VLA (Vision-Language-Action) embarquées, notamment en Europe chez Enchanted Tools ou Wandercraft, trouveront dans cette approche une piste concrète pour résoudre le sim-to-real gap lié aux contraintes d'ordonnancement.

UELes équipes embarquées européennes travaillant sur des architectures VLA, notamment Enchanted Tools et Wandercraft, pourraient exploiter l'approche RED pour résoudre les contraintes d'ordonnancement temps-réel sur matériel contraint.

RecherchePaper
1 source
Génie logiciel pour la robotique auto-adaptative : un programme de recherche
4arXiv cs.RO 

Génie logiciel pour la robotique auto-adaptative : un programme de recherche

Une équipe de chercheurs a soumis sur arXiv (réf. 2505.19629, troisième version) un agenda de recherche structuré pour le génie logiciel appliqué aux systèmes robotiques auto-adaptatifs. Contrairement aux robots industriels classiques dont le comportement est entièrement prédéfini au moment du déploiement, les systèmes auto-adaptatifs sont conçus pour modifier leur propre logique en cours d'exécution, en réponse à des environnements dynamiques et incertains. L'article organise cet agenda autour de deux axes : d'une part, le cycle de vie logiciel complet (spécification des exigences, conception, développement, test, opérations), adapté aux contraintes de l'auto-adaptation ; d'autre part, les technologies habilitantes telles que les jumeaux numériques (digital twins) et les mécanismes d'adaptation pilotés par l'IA, qui assurent la surveillance en temps réel, la détection de pannes et la prise de décision automatisée. L'enjeu central identifié par les auteurs est la vérifiabilité des comportements adaptatifs sous incertitude, un problème ouvert qui conditionne directement l'adoption industrielle. Les robots capables d'apprendre et de se reconfigurer en production posent en effet des questions radicalement différentes de celles que traitent les standards de sécurité fonctionnelle classiques comme l'IEC 61508 ou l'ISO 26262. L'article cible notamment la difficulté à équilibrer trois contraintes contradictoires : adaptabilité, performance et sécurité. Il propose d'intégrer des frameworks formels comme MAPE-K (Monitor, Analyze, Plan, Execute, Knowledge), boucle de contrôle réflexif issue de l'autonomic computing d'IBM, et sa variante étendue MAPLE-K, comme socles architecturaux unifiants pour l'ingénierie de ces systèmes. Ce travail s'inscrit dans une dynamique académique qui s'accélère depuis l'émergence des VLA (Vision-Language-Action models) et des approches sim-to-real à grande échelle. Des communautés concurrentes, notamment autour de ROS 2 Lifecycle, des architectures behavior trees, et du model-driven engineering for robotics (MDE4R), explorent des directions parallèles. Les auteurs formalisent une feuille de route vers 2030, visant des systèmes robotiques dits trustworthy, capables d'opérer sans supervision humaine continue dans des environnements industriels réels. Il convient de situer ce papier pour ce qu'il est : un agenda de recherche, pas un produit livré ni un déploiement annoncé. Il cartographie les problèmes à résoudre, pas les solutions disponibles.

UELes questions de vérifiabilité des comportements adaptatifs sous incertitude sont indirectement pertinentes pour les industries européennes soumises aux normes IEC 61508 et à l'AI Act, mais aucun acteur français ou européen n'est impliqué dans ce travail.

RecherchePaper
1 source