RecherchearXiv cs.RO6sem

À qui est cet objet ? Inférence contextuelle de propriété par questionnement sous incertitude

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2605.28087) un framework appelé COIN, Context-Aware Object Ownership Inference with Uncertainty-Guided Questioning, conçu pour permettre aux robots de service d'inférer à qui appartient un objet. L'objectif est de résoudre des instructions courantes comme "apporte-moi ma tasse", qui supposent que le robot sache distinguer les objets selon leur propriétaire. Le système combine un grand modèle de langage (LLM) pour estimer des scores de propriété à partir de l'historique d'utilisation des objets et des profils des utilisateurs présents, avec une couche de prédiction conforme (conformal prediction) qui construit un ensemble de propriétaires plausibles. Quand l'incertitude dépasse un seuil, le robot génère activement des questions pour lever l'ambiguïté. Les expériences, menées en environnement domestique simulé, rapportent un Subset Accuracy de 0,988 et un Mean Jaccard Index de 0,991, y compris dans des scénarios de partage temporaire ou de copropriété.

Ce travail s'attaque à un problème structurel de la robotique de service : la propriété d'un objet est un attribut latent, non observable directement, et les approches existantes reposent typiquement sur le seul critère de l'utilisation récente, ce qui les rend fragiles dès qu'un objet change de main temporairement. L'intégration d'un LLM pour le raisonnement contextuel, combinée à une gestion explicite de l'incertitude via la prédiction conforme, représente une architecture plus robuste pour des déploiements réels. Pour un intégrateur travaillant sur des robots d'assistance à domicile ou en Ehpad, c'est un signal que les systèmes de compréhension sémantique des instructions deviennent suffisamment fiables pour envisager des scénarios multi-utilisateurs.

À noter que les résultats sont obtenus en simulation uniquement, et qu'aucune validation sur robot physique n'est mentionnée dans l'article. Ce gap sim-to-real reste la principale inconnue. La robotique de service domestique connaît une accélération des travaux en HRI (Human-Robot Interaction), avec des acteurs comme 1X, Apptronik, ou encore le français Enchanted Tools sur le segment des robots conversationnels. Le projet dispose d'une page dédiée, ce qui suggère une poursuite des travaux, mais aucune timeline de déploiement ni partenariat industriel n'est annoncé à ce stade.

Impact France/UE

Enchanted Tools est cité comme exemple d'acteur français dans le segment des robots conversationnels, mais ce travail de recherche n'implique pas directement d'entités françaises ou européennes.

Dans nos dossiers

Apptronik Apollo Enchanted Tools — Mirokaï arXiv cs.RO

À lire aussi

1arXiv cs.RO

Coordination multirobot pour la planification sous incertitude contextuelle

Un article de recherche publié sur arXiv (2603.13748v3, version révisée) s'attaque à un problème central pour les flottes de robots mobiles : comment agir efficacement quand la priorité des objectifs dépend d'un contexte opérationnel inconnu au départ. Les auteurs formalisent ce problème sous le nom de MR-CUSSP (Multi-Robot Context-Uncertain Stochastic Shortest Path), un cadre qui modélise la collecte d'informations contextuelles via des observations conjointes prises à des états repères ("landmark states"). Leur solution se décompose en deux étages : CIMOP (Coordinated Inference for Multi-Objective Planning), qui calcule des plans guidant les robots vers ces points informatifs pour inférer rapidement le contexte réel, puis LCBS (Lexicographic Conflict-Based Search), un planificateur multi-robot sans collision qui hiérarchise les objectifs selon l'ordre de préférence induit par ce contexte. L'équipe valide son approche sur trois domaines simulés, puis sur un déploiement physique impliquant cinq robots mobiles dans un scénario appelé "salp domain". L'enjeu pratique est réel pour tout opérateur de flottes robotiques évoluant dans des environnements où les règles du jeu changent selon la situation : un robot logistique en entrepôt, un AMR en usine ou un essaim d'exploration peut avoir des priorités radicalement différentes selon un contexte non observable directement (urgence, présence humaine, type de charge). Agir sur la base d'une hypothèse de contexte erronée peut produire un comportement mal aligné, voire dangereux. Ce travail illustre une tendance de fond en planification multi-robot : coupler explicitement l'inférence active (où aller pour lever l'incertitude) et l'optimisation lexicographique des tâches, plutôt que de traiter ces deux problèmes séparément. C'est un signal utile pour les équipes de recherche en coordination multi-agents, même si la validation physique reste limitée à cinq unités et un scénario contrôlé, loin d'un déploiement industriel à grande échelle. Ce travail s'inscrit dans la lignée des recherches sur la planification de chemins multi-robot sous contrainte (le "Conflict-Based Search" est une famille d'algorithmes bien établie dans ce domaine) et sur la prise de décision séquentielle dans l'incertitude (les Stochastic Shortest Path problems). La contribution spécifique ici est l'ajout d'une dimension de préférences lexicographiques dépendantes du contexte, une brique qui pourrait intéresser des acteurs académiques et industriels travaillant sur des flottes hétérogènes en environnement partiellement observable. Le fait qu'il s'agisse d'une version "replace" sur arXiv suggère un article déjà en révision, potentiellement en vue d'une soumission à une conférence de robotique majeure, sans qu'aucune date de publication définitive ne soit précisée.

RecherchePaper

1 source

2arXiv cs.RO

MPPI sous contraintes probabilistes, incertitudes d'état et d'objets dynamiques : calibration du risque de collision

Une équipe de chercheurs publie sur arXiv en mai 2026 (preprint 2505.28330) une contribution en deux volets pour la navigation probabiliste en environnements dynamiques. D'abord, une méthodologie d'évaluation de la calibration des risques de collision en boucle fermée, fondée sur les proper scoring rules, des métriques statistiques qui mesurent si les probabilités de collision annoncées par le système correspondent à ce qui se produit réellement. Ensuite, l'architecture DUCCT-MPPI (Dual-Uncertainty Chance-Constrained Tube Model Predictive Path Integral), conçue pour fonctionner en temps réel: elle intègre simultanément l'incertitude de localisation via une approximation Unscented Transform (UT) à un tube, et l'incertitude de prédiction des obstacles dynamiques via agrégation Monte Carlo. Dans des simulations physiques en environnements très encombrés, DUCCT-MPPI affiche un taux de succès de navigation supérieur de 28 % aux baselines Monte Carlo MPPI classiques, tout en enregistrant les temps de trajet les plus courts et des forces sociales induites minimisées. L'enjeu central est la calibration: les planificateurs à contraintes probabilistes (chance-constrained planners) supposent implicitement que les incertitudes fournies par la localisation et la perception sont statistiquement fiables, ce qui n'est pas garanti en conditions réelles. Une confiance excessive provoque des violations de sécurité systématiques; une confiance insuffisante génère des comportements de gel ou de dilution des probabilités, paralysant le robot dans les situations complexes. En quantifiant formellement cette erreur de calibration en boucle fermée, les auteurs exposent un angle mort critique pour le déploiement d'AMR et de robots mobiles dans des entrepôts, usines ou espaces partagés avec des humains. Le Chance-Constrained MPPI est une évolution du framework MPPI introduit par Grady Williams et al. (Georgia Tech, 2017), qui génère des trajectoires par échantillonnage massif de perturbations de commande pondéré par un critère de coût. Les approches concurrentes dans l'espace incluent le tube MPC stochastique, les méthodes CVaR (Conditional Value-at-Risk) et les planificateurs bayésiens. Ce preprint reste à valider sur hardware réel: l'ensemble des expériences repose sur de la simulation physique, sans déploiement annoncé sur robot ou plateforme spécifique, une limite classique du sim-to-real gap que les auteurs n'adressent pas explicitement.

RecherchePaper

1 source

3arXiv cs.RO

Autonomie robotique à seuil de confiance : quand l'incertitude est-elle vraiment utile ?

Des chercheurs ont déposé sur arXiv (2605.18045) une étude systématique sur l'autonomie à seuil de confiance, mécanisme par lequel un robot décide d'agir de façon autonome ou de déléguer à une politique de repli selon son niveau d'incertitude prédictive. L'équipe a comparé trois familles de méthodes d'estimation de l'incertitude (heuristiques softmax, MC Dropout, ensembles de modèles) sur trois benchmarks de reconnaissance d'activité temporelle, avant de valider les résultats dans une simulation embarquée multi-seed mesurant taux de collision et coût opérationnel. Les auteurs critiquent les métriques standard comme l'ECE (erreur de calibration attendue) et l'AUROC : ces indicateurs ne testent pas directement si l'incertitude modifie la décision agir/déléguer. Ils proposent en remplacement une évaluation par corrélation de rang de Spearman, tests d'équivalence par bootstrap, et accord act/defer. Le résultat central contredit une hypothèse fréquente dans la robotique de déploiement : une fois un seuil de compétence minimal atteint par le modèle de base, les trois méthodes produisent des comportements de gating quasi-identiques. C'est le choix du seuil de décision qui pèse le plus sur les résultats d'exécution, bien davantage que la sophistication de la méthode d'incertitude choisie. En pratique, un proxy simple (softmax) suffit pour le gating sélectif dès lors que le modèle est compétent. Revers de la médaille : la détection sémantique hors-distribution fine-grained reste proche du hasard même avec des ensembles de modèles. Les systèmes actuels ne savent pas identifier une situation véritablement inédite, ce qui représente un angle mort critique pour les robots opérant en environnements non contrôlés. Ce travail s'inscrit dans le champ de l'autonomie partagée (shared autonomy), question centrale pour les robots collaboratifs et les AMR industriels. Les méthodes comparées (MC Dropout, Gal et Ghahramani 2016 ; ensembles, Lakshminarayanan 2017) font figure de références établies dans le domaine. Les résultats relativisent les arguments commerciaux en faveur des estimateurs bayésiens avancés pour le déploiement terrain, un sujet directement pertinent pour des acteurs comme Boston Dynamics, Figure AI, Apptronik ou Intrinsic (Alphabet), dont les systèmes doivent décider en temps réel quand solliciter un opérateur humain. Les auteurs annoncent comme prochaines étapes l'extension à des modalités sensorielles plus riches et à des scénarios de décalage de covariable plus agressifs, pour tester la robustesse des conclusions hors du cadre benchmarké.

RecherchePaper

1 source

4arXiv cs.RO

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle

Une équipe de chercheurs a publié sur arXiv (réf. 2606.29222) un planificateur de navigation autonome baptisé CORE (Contextual-memory Oriented Reinforcement-learning), conçu pour guider un robot dans des environnements inconnus sans carte préalable. L'architecture combine un graphe de visibilité sparse pour la représentation structurée de l'espace, un réseau Transformer pour la compréhension globale de l'environnement, et un mécanisme de mémoire contextuelle pour éviter les optima locaux dans les grandes scènes. Testé face au planificateur traditionnel FAR Planner et à plusieurs baselines d'apprentissage par renforcement, CORE réduit la distance de déplacement de 13 % par rapport à FAR Planner et jusqu'à 48 % face aux meilleures méthodes d'apprentissage, avec des gains qui s'accentuent dans les environnements complexes. Fait notable : le modèle réalise un transfert sim-to-real en zéro-shot, sans fine-tuning sur données réelles, après entraînement exclusif sur des environnements simulés basés sur l'image. Le code est disponible en accès libre sur GitHub. Ce résultat s'attaque à un verrou persistant de la navigation mobile : la dégradation des performances lors du passage du simulateur au monde réel. La plupart des méthodes d'apprentissage par renforcement nécessitent soit une domain randomization poussée, soit un fine-tuning coûteux sur données terrain. Ici, le zéro-shot sim-to-real est démontré en environnement physique sans intervention humaine, résultat significatif si les conditions expérimentales sont généralisables. Pour les intégrateurs et équipes R&D, l'enjeu concret est double : réduction de la distance parcourue (efficacité énergétique, temps de cycle) et capacité à opérer dans des espaces non cartographiés, scénario courant en logistique, BTP ou exploration. La navigation en environnements inconnus s'appuie historiquement sur le SLAM, avec des contributions majeures d'ETH Zurich, Carnegie Mellon ou l'INRIA côté européen. FAR Planner (CMU), utilisé ici comme référence de comparaison, reste une baseline solide mais à règles fixes. Sur le plan industriel, Boston Dynamics, ANYbotics ou Exotec intègrent des planificateurs propriétaires dans leurs flottes de robots mobiles. CORE se positionne comme une alternative légère, entraînable sur image seule, mais reste à ce stade une contribution académique sans déploiement industriel annoncé. La robustesse face aux obstacles dynamiques, non testée dans cette version, constituera l'étape critique pour une éventuelle industrialisation.

UELe code open-source pourrait être évalué par des équipes R&D françaises (Exotec, intégrateurs logistiques) pour la navigation en espaces non cartographiés, mais il n'y a pas de lien institutionnel direct avec la France ou l'UE.

RecherchePaper

1 source