RecherchearXiv cs.RO1h

Optimisation non linéaire à grande échelle : de nombreux problèmes, un seul GPU

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié fin juin 2026 sur arXiv jaxipm, présenté comme le premier solveur de programmes non linéaires (NLP) capable de traiter des lots de problèmes simultanément sur GPU. Construit sur la base algorithmique d'IPOPT, le solveur de référence dans les pipelines de planification en robotique, et implémenté en JAX, jaxipm atteint jusqu'à 32,85 fois le débit d'IPOPT classique sur des benchmarks de contrôle prédictif non linéaire (NMPC) pour drones quadrotors. Les scénarios testés couvrent le suivi de trajectoire en présence d'obstacles, la navigation multi-drones sans collision, et l'évitement en environnement encombré. Le code est disponible en open source sur GitHub (johnviljoen/jaxipm).

L'enjeu est structurel : les solveurs NLP matures comme IPOPT offrent des garanties de satisfaction de contraintes et d'optimalité locale introuvables dans les méthodes par apprentissage par renforcement (RL) ou MPPI, mais ils sont mono-thread et CPU-bound, incompatibles avec les pipelines GPU-batched qui dominent la recherche robotique moderne. Cette incompatibilité a creusé un fossé entre deux familles d'approches : les solveurs à gradients, précis mais séquentiels, et les méthodes d'échantillonnage, parallélisables mais sans garanties formelles. jaxipm comble ce fossé via deux innovations : la "heterogeneous iteration fusion", qui supprime le branchement conditionnel dans la boucle interne d'IPOPT, et l'"iteration level batching", qui minimise les temps morts du GPU lors du traitement simultané de N instances indépendantes. Pour les équipes de motion planning souhaitant coupler planification contrainte et apprentissage dans une boucle unifiée, ce type de solveur change le régime de ce qui est calculable en temps quasi-réel.

IPOPT, développé à partir des années 2000 à Argonne National Laboratory, est le standard de facto en robotique pour la planification de trajectoires, la cinématique inverse, et la gestion de contacts. Son intégration dans des frameworks modernes comme MuJoCo MPC ou les pipelines Pinocchio reste cependant bridée par sa nature séquentielle. Face à l'essor des simulateurs GPU-batched comme IsaacLab (NVIDIA) ou MJX (Google DeepMind), capables de générer des millions de rollouts par seconde, l'absence d'un solveur NLP au même format représentait un goulot d'étranglement pour les approches hybrides. jaxipm est pour l'instant validé uniquement sur des benchmarks drones quadrotors, ce qui appelle une évaluation sur configurations manipulateurs ou robots humanoïdes avant de pouvoir généraliser les gains annoncés à l'ensemble du spectre robotique.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

cuNRTO : optimisation de trajectoires robustes non linéaires accélérée par GPU

Des chercheurs ont mis en ligne sur arXiv (réf. 2603.02642v2) cuNRTO (CUDA Nonlinear Robust Trajectory Optimization), un framework GPU pour l'optimisation de trajectoire robuste sous incertitude bornée. Ces problèmes mènent typiquement à des contraintes de programmation conique du second ordre (SOCP), dont la résolution est très coûteuse sur CPU. Les auteurs proposent deux architectures : NRTO-DR, basée sur le splitting de Douglas-Rachford pour paralléliser les projections SOCP et les résolutions directes creuses, et NRTO-FullADMM, une variante inédite exploitant l'ADMM (Alternating Direction Method of Multipliers) pour améliorer la scalabilité en tirant parti de la structure du problème. L'implémentation repose sur des kernels CUDA personnalisés pour les projections SOC et des chaînes cuBLAS GEMM pour les mises à jour des gains de retour d'état. Testées en simulation sur un modèle unicycle, un quadrirotor et le bras manipulateur Franka Emika, les deux architectures atteignent des accélérations allant jusqu'à 139,6x par rapport aux solveurs CPU de référence. L'enjeu est concret pour les équipes robotique et les intégrateurs : l'optimisation de trajectoire robuste en temps réel reste aujourd'hui hors de portée des architectures CPU pour la plupart des applications embarquées, les solveurs classiques étant cantonnés à une planification hors ligne ou à très basse fréquence. Un gain de 139,6x ouvre la voie à une réplanification en boucle fermée sur des manipulateurs industriels et des drones opérant sous incertitudes réelles (charges variables, perturbations mécaniques). Nuance importante : l'ensemble des benchmarks est produit en simulation. Le gap sim-to-real sur GPU embarqués, où la latence mémoire et la bande passante sont significativement plus contraintes que sur un serveur de calcul, reste entièrement à valider avant tout déploiement opérationnel. Ce travail s'inscrit dans la continuité des efforts d'accélération GPU pour le contrôle optimal, dont cuRobo (NVIDIA) et les variantes GPU de l'MPPI sont les exemples les plus connus. L'optimisation robuste avec contraintes SOCP reste un angle peu couvert par ces frameworks, les formulations quadratiques classiques étant structurellement plus simples à paralléliser. Le papier est un preprint arXiv en version v2, pas encore évalué par une conférence de référence comme ICRA, IROS ou RSS. Le code sera rendu public via cunrto.github.io, ce qui permettra des comparaisons indépendantes. La prochaine étape logique serait une validation hardware sur GPU embarqués de type NVIDIA Jetson Orin, représentatifs du déploiement cible en robotique autonome.

RecherchePaper

1 source

2arXiv cs.RO

LEMON-Mapping : fusion et optimisation multi-session de nuages de points à grande échelle pour une cartographie globalement cohérente

LEMON-Mapping (Loop-Enhanced Large-Scale Multi-Session Point Cloud Merging and Optimization) est un framework de cartographie collaborative multi-robots présenté dans un preprint arXiv (2505.10018, version 4). Le système vise à fusionner des nuages de points 3D issus de plusieurs robots opérant en sessions distinctes pour produire une carte globalement cohérente à grande échelle. Trois innovations structurent la contribution: un mécanisme de traitement des fermetures de boucles (loop closures) intégrant le rejet d'outliers et une stratégie de rappel pour récupérer des boucles valides erronément filtrées; un bundle adjustment spatial adapté aux cartes multi-robots, qui réduit divergence et flou dans les zones de recouvrement; et une optimisation de graphe de poses (PGO) propageant la précision locale à l'ensemble de la carte via des contraintes de bundle adjustment raffinées. L'intérêt tient à une limitation bien documentée des méthodes PGO classiques: celles-ci traitent les loop closures uniquement comme des contraintes entre noeuds de pose, ignorant la structure géométrique du nuage de points, ce qui produit des trajectoires divergentes et des zones floues dans les régions de chevauchement entre robots. En intégrant un bundle adjustment spatial dans la boucle d'optimisation, LEMON-Mapping montre qu'il est possible de corriger ces défauts de manière structurelle. Les auteurs valident leur approche sur plusieurs benchmarks publics et un dataset propriétaire, avec des résultats supérieurs aux méthodes de fusion traditionnelles en termes de précision et de cohérence globale. Des tests de scalabilité confirment que le framework supporte des flottes de robots nombreuses. La cartographie collaborative multi-robots est un verrou actif pour les AMR d'entrepôt, les drones d'inspection industrielle et la robotique de construction. Le domaine dispose déjà de frameworks comparables: DiSCo-SLAM, Swarm-SLAM ou CoLRIO explorent des approches distribuées avec différentes architectures de communication. LEMON-Mapping se positionne dans la lignée des travaux combinant PGO et bundle adjustment inspiré du structure-from-motion, appliqué aux nuages de points LiDAR multi-sessions. Le preprint en est à sa quatrième révision, signe d'un travail en cours de maturation; aucune disponibilité open-source ni déploiement pilote n'est mentionné à ce stade.

RecherchePaper

1 source

3arXiv cs.RO

Optimisation bayésienne pour l'apprentissage du MPC non linéaire dans la navigation d'agents autonomes

Des chercheurs ont publié le 17 juin 2026 (arXiv:2606.14763) un framework de navigation autonome temps-réel combinant planification réactive, représentation d'occupation gaussienne par LiDAR et contrôle prédictif non-linéaire (MPC). À chaque cycle de contrôle, le système construit une carte d'occupation gaussienne à partir des données LiDAR, génère une trajectoire sans collision via algorithme A*, puis la fait suivre par un MPC formulé avec CasADi/IPOPT intégrant une barrière obstacle à sigmoïde lisse. Le tuning des paramètres du contrôleur est réalisé hors-ligne par optimisation bayésienne via Tree-structured Parzen Estimators (TPE), complétée d'un surrogate Gaussian Process pour analyser la sensibilité paramétrique. Déployé sur le quadrupède Unitree Go2, le système atteint un taux de succès de navigation de 90,0 % en conditions réelles et une amélioration moyenne de 38,9 % sur les métriques composites en simulation, sans retuning supplémentaire entre sim et hardware. Le résultat le plus significatif pour le secteur est la validation du transfert sim-to-real sans post-tuning sur hardware : les paramètres identifiés en Gazebo tiennent sur le robot physique à performances comparables. C'est un point non trivial pour les équipes d'intégration robotique, où la divergence simulation/réalité reste un goulot d'étranglement majeur. L'approche "map-free" (sans cartographie préalable) combinée à un MPC réactif positionne ce framework pour des environnements dynamiques non-structurés, là où les planificateurs à carte globale échouent. La nature robot-agnostique de l'architecture élargit le périmètre d'application au-delà du quadrupède testé. Ce travail s'inscrit dans un mouvement de recherche plus large visant à rendre le MPC praticable sur des plateformes embarquées à ressources limitées, en externalisant le coût computationnel du tuning vers une phase offline. Les concurrents directs incluent les approches RL-for-MPC (apprentissage de politiques qui paramètrent le contrôleur) et les méthodes de navigation end-to-end par réseau de neurones, mais ces dernières offrent moins de garanties de sécurité formelles. Le Unitree Go2, plateforme open-source à ~2 700 USD, est devenu un banc de test standard dans la communauté académique. Les suites naturelles incluent l'extension à des dynamiques multi-agents et le test sur plateformes à roues ou bras manipulateurs.

RecherchePaper

1 source

4arXiv cs.RO

Planification d'inspection évolutive par programmation linéaire en nombres entiers à base de flots

Une équipe de chercheurs a publié sur arXiv (2603.16593v2) une méthode MILP (programmation linéaire mixte en nombres entiers) pour résoudre la planification d'inspection robotique à grande échelle. L'objectif est de calculer le chemin le plus court permettant à un robot d'inspecter un ensemble de points d'intérêt (POI) via ses capteurs, problème central en robotique industrielle et médicale. En reformulant les contraintes de couverture et de connectivité du problème de planification sur graphe (GIP) comme un flux réseau, les auteurs construisent des modèles MILP efficaces associés à un solveur Branch-and-Cut spécialisé. Les résultats sur benchmarks médicaux et d'infrastructure montrent une réduction des écarts d'optimalité de 30 à 50 % et une capacité à traiter des instances comportant jusqu'à 15 000 sommets et des milliers de POI, là où les méthodes précédentes s'épuisaient en mémoire ou ne fournissaient aucune garantie significative. L'enjeu opérationnel est direct pour les intégrateurs industriels : la planification d'inspection devient un goulot d'étranglement dès que le nombre de POI dépasse quelques centaines, seuil couramment franchi lors de l'inspection de soudures en usine, de turbines éoliennes ou de structures de génie civil. En rendant le problème structurellement exploitable par les solveurs modernes, cette approche combine garanties d'optimalité et passage à l'échelle, deux propriétés que les méthodes par échantillonnage (RRT, PRM) ne pouvaient pas fournir simultanément. Une réduction de 30 à 50 % des écarts d'optimalité se traduit directement en chemins plus courts, donc en temps de cycle réduits et coûts d'exploitation plus faibles, sans sacrifier la couverture complète des points critiques. Le problème de planification d'inspection est apparenté au problème du voyageur de commerce (TSP) et à ses variantes couverture-connectivité. Les approches dominantes reposaient jusqu'ici sur l'échantillonnage de l'espace (RRT, PRM) pour construire un graphe discret, puis sur des heuristiques ou des formulations MILP moins performantes pour le résoudre. Cette contribution s'inscrit dans un mouvement plus large vers les formulations exactes, rendu possible par la progression des solveurs commerciaux comme Gurobi et CPLEX ainsi qu'open-source comme SCIP. Il s'agit pour l'instant d'une publication académique sans déploiement commercial annoncé, mais le cadre s'applique naturellement à l'inspection d'infrastructure (ponts, pipelines, éoliennes offshore) et à la robotique médicale (endoscopie, radiothérapie guidée par robot). Les extensions attendues concernent l'intégration de contraintes dynamiques du robot et de la perception en temps réel dans le modèle d'optimisation.

UECette méthode MILP pourrait améliorer l'efficacité des robots d'inspection d'infrastructures européennes (éoliennes offshore, ponts, pipelines) en réduisant les temps de cycle de 30 à 50 %, mais aucun déploiement ou partenariat européen n'est annoncé à ce stade.

RecherchePaper

1 source