Aller au contenu principal
MPPI sous contraintes probabilistes, incertitudes d'état et d'objets dynamiques : calibration du risque de collision
RecherchearXiv cs.RO2h

MPPI sous contraintes probabilistes, incertitudes d'état et d'objets dynamiques : calibration du risque de collision

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs publie sur arXiv en mai 2026 (preprint 2505.28330) une contribution en deux volets pour la navigation probabiliste en environnements dynamiques. D'abord, une méthodologie d'évaluation de la calibration des risques de collision en boucle fermée, fondée sur les proper scoring rules, des métriques statistiques qui mesurent si les probabilités de collision annoncées par le système correspondent à ce qui se produit réellement. Ensuite, l'architecture DUCCT-MPPI (Dual-Uncertainty Chance-Constrained Tube Model Predictive Path Integral), conçue pour fonctionner en temps réel: elle intègre simultanément l'incertitude de localisation via une approximation Unscented Transform (UT) à un tube, et l'incertitude de prédiction des obstacles dynamiques via agrégation Monte Carlo. Dans des simulations physiques en environnements très encombrés, DUCCT-MPPI affiche un taux de succès de navigation supérieur de 28 % aux baselines Monte Carlo MPPI classiques, tout en enregistrant les temps de trajet les plus courts et des forces sociales induites minimisées.

L'enjeu central est la calibration: les planificateurs à contraintes probabilistes (chance-constrained planners) supposent implicitement que les incertitudes fournies par la localisation et la perception sont statistiquement fiables, ce qui n'est pas garanti en conditions réelles. Une confiance excessive provoque des violations de sécurité systématiques; une confiance insuffisante génère des comportements de gel ou de dilution des probabilités, paralysant le robot dans les situations complexes. En quantifiant formellement cette erreur de calibration en boucle fermée, les auteurs exposent un angle mort critique pour le déploiement d'AMR et de robots mobiles dans des entrepôts, usines ou espaces partagés avec des humains.

Le Chance-Constrained MPPI est une évolution du framework MPPI introduit par Grady Williams et al. (Georgia Tech, 2017), qui génère des trajectoires par échantillonnage massif de perturbations de commande pondéré par un critère de coût. Les approches concurrentes dans l'espace incluent le tube MPC stochastique, les méthodes CVaR (Conditional Value-at-Risk) et les planificateurs bayésiens. Ce preprint reste à valider sur hardware réel: l'ensemble des expériences repose sur de la simulation physique, sans déploiement annoncé sur robot ou plateforme spécifique, une limite classique du sim-to-real gap que les auteurs n'adressent pas explicitement.

Dans nos dossiers

À lire aussi

Planification robotique sous contraintes de ressources face à une incertitude mixte
1arXiv cs.RO 

Planification robotique sous contraintes de ressources face à une incertitude mixte

Des chercheurs présentent le CMDPST (Consumption Markov Decision Process with Set-valued Transitions), un cadre formel inédit permettant à un robot de planifier ses actions en tenant compte simultanément de deux types d'incertitudes : le bruit probabiliste mesurable et les inconnues structurellement non-quantifiables, tout en garantissant que le système ne tombe jamais à court de ressources opérationnelles (batterie, capacité de charge, quota de déplacements). Publiée sur arXiv en mai 2026 (réf. 2605.05797), la contribution couple ce modèle à une spécification de tâche exprimée en LTLf (logique temporelle linéaire sur traces finies), un formalisme permettant d'encoder des objectifs complexes avec des contraintes temporelles précises. Les auteurs proposent deux algorithmes de synthèse de stratégie : une méthode directe par déroulage d'états et une version optimisée par élagage de l'espace d'états, plus efficace en temps de calcul. Les expériences sont conduites sur un réseau de transport en entrepôt simulé, sans validation sur hardware réel à ce stade. La contribution adresse un angle mort récurrent dans la planification robotique industrielle : la plupart des approches existantes traitent soit l'incertitude probabiliste via les MDP classiques, soit les contraintes de ressources, rarement les deux ensemble. Dans les déploiements AMR (autonomous mobile robots) d'entrepôt, où une flotte doit honorer des missions tout en gérant niveaux de batterie et pannes imprévisibles, cette dualité est pourtant critique. Le cadre CMDPST offre aux intégrateurs une garantie formelle : la stratégie synthétisée ne laissera jamais un robot en panne sèche, même face à des perturbations non modélisées. C'est un argument solide pour des environnements industriels où l'interruption de service a un coût direct et mesurable. Ce type de planification sous contraintes mixtes s'inscrit dans un corpus plus large incluant la vérification probabiliste de modèles (outils PRISM, Storm) et la planification formelle par MDP. Les acteurs de la logistique automatisée comme Exotec (France) ou Hai Robotics, dont les flottes AMR évoluent dans des environnements partiellement inconnus, sont directement concernés par ces avancées théoriques. Côté alternatives académiques, le reinforcement learning robuste et le model predictive control probabiliste existent, mais sans les garanties formelles d'épuisement de ressources que revendique cette approche. La prochaine étape attendue est une implémentation sur robot physique pour évaluer concrètement le gap sim-to-real.

UEExotec (France) est explicitement citée comme acteur directement concerné par ces avancées théoriques, ses flottes AMR en entrepôt étant précisément le cas d'usage visé par les garanties formelles de non-épuisement des ressources du cadre CMDPST.

RecherchePaper
1 source
2arXiv cs.RO 

À qui est cet objet ? Inférence contextuelle de propriété par questionnement sous incertitude

Des chercheurs ont publié sur arXiv (arXiv:2605.28087) un framework appelé COIN, Context-Aware Object Ownership Inference with Uncertainty-Guided Questioning, conçu pour permettre aux robots de service d'inférer à qui appartient un objet. L'objectif est de résoudre des instructions courantes comme "apporte-moi ma tasse", qui supposent que le robot sache distinguer les objets selon leur propriétaire. Le système combine un grand modèle de langage (LLM) pour estimer des scores de propriété à partir de l'historique d'utilisation des objets et des profils des utilisateurs présents, avec une couche de prédiction conforme (conformal prediction) qui construit un ensemble de propriétaires plausibles. Quand l'incertitude dépasse un seuil, le robot génère activement des questions pour lever l'ambiguïté. Les expériences, menées en environnement domestique simulé, rapportent un Subset Accuracy de 0,988 et un Mean Jaccard Index de 0,991, y compris dans des scénarios de partage temporaire ou de copropriété. Ce travail s'attaque à un problème structurel de la robotique de service : la propriété d'un objet est un attribut latent, non observable directement, et les approches existantes reposent typiquement sur le seul critère de l'utilisation récente, ce qui les rend fragiles dès qu'un objet change de main temporairement. L'intégration d'un LLM pour le raisonnement contextuel, combinée à une gestion explicite de l'incertitude via la prédiction conforme, représente une architecture plus robuste pour des déploiements réels. Pour un intégrateur travaillant sur des robots d'assistance à domicile ou en Ehpad, c'est un signal que les systèmes de compréhension sémantique des instructions deviennent suffisamment fiables pour envisager des scénarios multi-utilisateurs. À noter que les résultats sont obtenus en simulation uniquement, et qu'aucune validation sur robot physique n'est mentionnée dans l'article. Ce gap sim-to-real reste la principale inconnue. La robotique de service domestique connaît une accélération des travaux en HRI (Human-Robot Interaction), avec des acteurs comme 1X, Apptronik, ou encore le français Enchanted Tools sur le segment des robots conversationnels. Le projet dispose d'une page dédiée, ce qui suggère une poursuite des travaux, mais aucune timeline de déploiement ni partenariat industriel n'est annoncé à ce stade.

UEEnchanted Tools est cité comme exemple d'acteur français dans le segment des robots conversationnels, mais ce travail de recherche n'implique pas directement d'entités françaises ou européennes.

RecherchePaper
1 source
Perception multimodale, ancrage linguistique, contrôle et saisie d'objets en interaction humain-robot : étude d'ablation
3arXiv cs.RO 

Perception multimodale, ancrage linguistique, contrôle et saisie d'objets en interaction humain-robot : étude d'ablation

Une étude soumise en mai 2025 sur arXiv (référence 2605.00963) présente une analyse par ablation d'un système de manipulation robotique piloté par interaction homme-robot multimodale, appliqué à une tâche de détection et saisie d'objets. Les chercheurs ont ciblé trois modules du pipeline : le modèle de langage chargé d'extraire les actions à partir d'instructions verbales, le système de perception assurant l'ancrage visuel des objets cibles, et le contrôleur gérant l'exécution du mouvement. L'étude compare trois LLM distincts, cinq configurations de perception, et trois contrôleurs, avant de soumettre les meilleures combinaisons à une analyse factorielle croisée en seconde phase. L'objectif déclaré n'est pas de redessiner le pipeline, mais d'isoler la contribution de chaque composant sous un protocole expérimental commun. Cette approche répond à une question directement actionnable pour les intégrateurs et ingénieurs robotiques : quel module optimiser en priorité pour améliorer le taux de succès, et lequel pour réduire le temps d'exécution ? Dans un contexte industriel, ces deux métriques obéissent à des contraintes distinctes selon les postes de travail, et les confondre dans une évaluation globale masque les vrais leviers d'amélioration. La méthodologie par ablation reste encore rare dans les publications de manipulation robotique, où la tendance est d'évaluer un seul composant à la fois, ce qui rend les résultats difficiles à reproduire ou à transposer d'un système à l'autre. Les auteurs précisent que l'analyse vise aussi à orienter les choix d'ingénierie dans les prochaines versions du système. Ce travail s'inscrit dans un effort plus large de la communauté pour rendre opérationnels les pipelines de manipulation guidés par langage hors des environnements contrôlés de laboratoire. Sur le plan concurrentiel, deux écoles s'affrontent actuellement : les modèles unifiés de type VLA (Vision-Language-Action) entraînés à grande échelle, comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, et les pipelines modulaires qui préservent la séparabilité des composants pour faciliter le débogage et l'adaptation sectorielle. L'étude n'annonce pas de déploiement industriel et reste pour l'instant au stade de la validation expérimentale. La prochaine étape logique serait de tester si les gains mesurés en laboratoire résistent au sim-to-real gap, qui demeure le principal obstacle à la mise en production des systèmes de manipulation guidés par instructions en langage naturel.

RecherchePaper
1 source
Planification kinodynamique avec coût terminal et incertitude apprise dans l'espace état-croyance
4arXiv cs.RO 

Planification kinodynamique avec coût terminal et incertitude apprise dans l'espace état-croyance

Une équipe du laboratoire elpis-lab publie KiTe, un planificateur cinodynamique qui introduit une formulation par coût terminal pour la planification de mouvements robotiques sous incertitude, soumis sur arXiv en mai 2026. Le travail étend AO-RRT (Asymptotically Optimal Rapidly-exploring Random Trees), l'algorithme de référence en planification cinodynamique, en ajoutant un objectif de qualité de l'état terminal plutôt que de traiter l'atteinte du but comme une contrainte binaire de faisabilité. Les auteurs prouvent formellement que cette extension préserve l'optimalité asymptotique d'AO-RRT. KiTe est ensuite étendu à l'espace de croyance (belief space) : la distance de Wasserstein entre la distribution terminale estimée et l'objectif sert de métrique, dont les auteurs démontrent qu'elle améliore une borne inférieure sur la probabilité d'atteindre la région cible. Pour les systèmes sans modèle analytique d'incertitude, les dynamiques et le bruit de processus sont appris directement depuis les données. Les expériences couvrent Flappy Bird, Car Parking et Planar Pushing en simulation, puis une validation réelle sur poussée planaire, avec des taux de succès supérieurs aux planificateurs de référence dans l'ensemble des configurations testées. L'enjeu dépasse la démonstration académique : les planificateurs cinodynamiques existants optimisent le coût cumulatif de trajectoire sans modéliser explicitement la qualité de l'état d'arrivée, les rendant fragiles face au bruit capteur, aux erreurs de modèle ou aux dynamiques non linéaires. En formulant la qualité terminale comme objectif à part entière et en intégrant des modèles d'incertitude appris, KiTe adresse directement le gap démonstration-réalité qui freine le déploiement de planificateurs en manipulation non structurée ou en environnement industriel. Pour un ingénieur ou un intégrateur, cela se traduit par des trajectoires plus robustes sans exiger un modèle dynamique parfait du système. La planification cinodynamique en espace de croyance est un domaine concurrentiel face à des approches comme MPPI (Model Predictive Path Integral), iLQR sous incertitude, ou les planificateurs basés sur des processus gaussiens. AO-RRT, sur lequel KiTe s'appuie, est une référence établie pour la planification à optimalité garantie avec contraintes dynamiques. La contribution de KiTe est à la fois théorique (preuve d'optimalité préservée sous l'objectif augmenté) et pratique (apprentissage des dynamiques depuis les données), avec le code disponible publiquement sur GitHub (elpis-lab/KiTe), ce qui facilite la reproductibilité et l'adoption par la communauté.

RecherchePaper
1 source