
Ne pas se faire avoir deux fois : s'adapter à l'adversité en conditions réelles grâce au raisonnement par expérience
Des robots mobiles autonomes déployés en environnements réels accumulent des erreurs qu'ils ne peuvent pas anticiper, et une équipe de chercheurs a publié sur arXiv (réf. 2605.31119) un cadre d'apprentissage continu baptisé "Don't Fool Me Twice" pour traiter ce problème. Le système observe les perturbations subies par le robot, en décrit les effets en langage naturel, puis interroge un VLM (vision-language model) enrichi de contexte visuel pour inférer leurs causes probables. La caractérisation locale de chaque perturbation s'effectue par régression à noyau, permettant une modélisation efficace en très peu d'exemples (few-shot). L'ensemble s'appuie sur un modèle spatial voxélique sémantique qui estime l'incertitude épistémique de chaque zone, permettant au robot de planifier ses trajectoires futures en tenant compte de ce qu'il a appris. Le cadre a été validé en simulation et sur matériel réel, sur plusieurs morphologies robotiques et types d'adversité, autour de quatre hypothèses formalisées dans le papier.
Ce travail comble un angle mort des approches actuelles : les VLMs peuvent dresser une liste générique des dangers d'un environnement, mais peinent à anticiper les adversités propres à une morphologie spécifique (les risques d'un robot à roues diffèrent de ceux d'un quadrupède). En basculant vers un apprentissage online post-déploiement, le système réduit l'écart sim-to-real qui handicape encore la plupart des solutions de navigation autonome en milieux ouverts. La modélisation de l'incertitude épistémique permet des comportements de récupération plus nuancés : le robot raisonne sémantiquement sur l'origine du problème, pas seulement sur l'évitement réactif.
L'approche s'inscrit dans un contexte de forte activité autour de la navigation AMR en milieux non structurés, où des acteurs comme Boston Dynamics, Clearpath Robotics ou ANYbotics cherchent à réduire la dépendance à une cartographie exhaustive préalable. Les travaux récents sur les VLMs appliqués à la prédiction de dangers, portés notamment par des groupes de CMU, ETH Zurich et Google DeepMind, se concentraient sur la prévention statique plutôt que sur l'adaptation continue après incident. "Don't Fool Me Twice" repositionne le problème sur l'apprentissage incrémental post-déploiement. Ce preprint arXiv ne mentionne ni partenaire industriel ni timeline de transfert technologique, et aucun résultat quantitatif précis n'est disponible dans le résumé soumis.
Dans nos dossiers




