
MPPI sous contraintes probabilistes, incertitudes d'état et d'objets dynamiques : calibration du risque de collision
Une équipe de chercheurs publie sur arXiv en mai 2026 (preprint 2505.28330) une contribution en deux volets pour la navigation probabiliste en environnements dynamiques. D'abord, une méthodologie d'évaluation de la calibration des risques de collision en boucle fermée, fondée sur les proper scoring rules, des métriques statistiques qui mesurent si les probabilités de collision annoncées par le système correspondent à ce qui se produit réellement. Ensuite, l'architecture DUCCT-MPPI (Dual-Uncertainty Chance-Constrained Tube Model Predictive Path Integral), conçue pour fonctionner en temps réel: elle intègre simultanément l'incertitude de localisation via une approximation Unscented Transform (UT) à un tube, et l'incertitude de prédiction des obstacles dynamiques via agrégation Monte Carlo. Dans des simulations physiques en environnements très encombrés, DUCCT-MPPI affiche un taux de succès de navigation supérieur de 28 % aux baselines Monte Carlo MPPI classiques, tout en enregistrant les temps de trajet les plus courts et des forces sociales induites minimisées.
L'enjeu central est la calibration: les planificateurs à contraintes probabilistes (chance-constrained planners) supposent implicitement que les incertitudes fournies par la localisation et la perception sont statistiquement fiables, ce qui n'est pas garanti en conditions réelles. Une confiance excessive provoque des violations de sécurité systématiques; une confiance insuffisante génère des comportements de gel ou de dilution des probabilités, paralysant le robot dans les situations complexes. En quantifiant formellement cette erreur de calibration en boucle fermée, les auteurs exposent un angle mort critique pour le déploiement d'AMR et de robots mobiles dans des entrepôts, usines ou espaces partagés avec des humains.
Le Chance-Constrained MPPI est une évolution du framework MPPI introduit par Grady Williams et al. (Georgia Tech, 2017), qui génère des trajectoires par échantillonnage massif de perturbations de commande pondéré par un critère de coût. Les approches concurrentes dans l'espace incluent le tube MPC stochastique, les méthodes CVaR (Conditional Value-at-Risk) et les planificateurs bayésiens. Ce preprint reste à valider sur hardware réel: l'ensemble des expériences repose sur de la simulation physique, sans déploiement annoncé sur robot ou plateforme spécifique, une limite classique du sim-to-real gap que les auteurs n'adressent pas explicitement.
Dans nos dossiers



