Co-GLANCE : perception active sous incertitude…

Planification assistée par éclaireur pour équipes de robots hétérogènes en environnements partiellement connus

35

1arXiv cs.RO

Planification assistée par éclaireur pour équipes de robots hétérogènes en environnements partiellement connus

Des chercheurs ont publié sur arXiv (arXiv:2605.22693) un cadre de planification appelé Scout-Assisted Planning (SAP), conçu pour des équipes robotiques hétérogènes évoluant dans des environnements partiellement cartographiés. Le problème ciblé est concret : lorsqu'un robot terrestre (UGV) progresse sur un réseau routier dont certaines voies sont bloquées, il ne le découvre qu'en s'y engageant physiquement, générant des détours coûteux. SAP intègre des drones éclaireurs (UAV) qui collectent de l'information en avance de phase pour guider les UGV. Pour cibler les reconnaissances les plus utiles, les auteurs introduisent l'Information Gain-based Action Pruning (IGAP), un mécanisme qui score chaque action de scouting selon son impact attendu sur le comportement du robot au sol. Comme le calcul exact de l'IGAP est prohibitif en temps réel, un modèle Graph Neural Network (GNN) est entraîné à prédire ces valeurs directement depuis la structure du graphe routier et l'état de croyance courant. Sur trois types d'environnements testés, SAP avec IGAP réduit le coût de déplacement des UGV de 31,9 à 37,7 % par rapport à la baseline Canadian Traveler Problem, et surpasse de 8 à 14 % les approches de guidage par proximité. Ces résultats pointent vers un verrou industriel réel : dans la logistique d'entrepôt, la réponse à sinistre, ou les opérations minières, un robot terrestre contraint de faire demi-tour mobilise du temps machine et perturbe les flux. L'apport de SAP est de rendre la décision de scouting dirigée par la valeur informationnelle plutôt que par la simple distance, un glissement non trivial. L'usage d'un GNN pour approximer l'IGAP est l'élément clé : il ramène le planning à des niveaux temps réel sans dégradation mesurable de la qualité de solution, ce qui ouvre la voie à un déploiement embarqué sur matériel contraint. La distinction entre guidage par information et guidage par proximité, avec 8 à 14 % d'écart, valide quantitativement que la sophistication algorithmique se traduit en gains opérationnels réels. Ce travail s'inscrit dans un courant de recherche actif sur la planification multi-robots hétérogènes, où drones et robots terrestres forment des binômes complémentaires. La formulation s'appuie sur le Canadian Traveler Problem, un cadre classique de navigation sous incertitude, et l'étend avec une couche d'apprentissage automatique. Les acteurs industriels proches de cette problématique incluent Boston Dynamics (Spot + drones), Exotec pour la logistique autonome en entrepôt, ou encore les consortiums de robotique minière australiens. La prochaine étape naturelle serait la validation sur plateforme physique réelle : les expériences rapportées restent simulées, et le sim-to-real gap sur des graphes routiers dynamiques reste un défi non résolu par cet article.

UERésultats encore simulés, mais la méthode pourrait bénéficier indirectement à des acteurs logistiques européens comme Exotec lors d'une éventuelle validation sur plateforme physique réelle.

RecherchePaper

1 source

SwarmCoDe : cadre de co-conception évolutif pour essaims de robots hétérogènes par spéciation dynamique

33

2arXiv cs.RO

SwarmCoDe : cadre de co-conception évolutif pour essaims de robots hétérogènes par spéciation dynamique

SwarmCoDe est un algorithme de co-évolution collaborative (CCEA) présenté dans un preprint arXiv (2603.26240v2) qui vise à automatiser la co-conception d'essaims de robots hétérogènes à grande échelle. La méthode centrale, dite "spéciation dynamique", fait émerger automatiquement des espèces de robots distinctes en fonction de la complexité de la tâche, sans les définir a priori. L'algorithme optimise simultanément la planification de tâches et la morphologie physique des robots, sous contrainte de budget de fabrication. Il intègre un "gène de dominance" qui dicte la composition de l'essaim, et des "tags génétiques" inspirés de mécanismes biologiques de coopération inter-espèces, permettant aux agents d'identifier des partenaires bénéfiques sans frontières prédéfinies. Les expériences rapportées, toutes simulées, montrent des essaims pouvant atteindre 200 agents, soit quatre fois la taille de la population évolutionnaire utilisée pour les générer. Le problème que SwarmCoDe cherche à résoudre est structurel : dans les approches classiques, la co-conception d'un essaim devient rapidement intractable à mesure que le nombre d'agents augmente, l'espace de design croissant exponentiellement. Le gène de dominance découple la taille physique de l'essaim de la population évolutionnaire, ce qui constitue la contribution technique principale : elle rend le calcul viable pour de grands systèmes sans explosion des ressources computationnelles. Pour les intégrateurs industriels et les équipes R&D déployant des flottes de robots, cela ouvre la perspective d'une optimisation automatique de la diversité matérielle, plutôt qu'une définition manuelle du mix robotique. Les améliorations marginales sur chaque unité se composent à l'échelle, ce qui explique pourquoi le co-design est stratégique dès qu'on parle de dizaines ou centaines d'agents en déploiement réel. La co-conception robotique est un domaine actif depuis une décennie, mais généralement appliquée à des robots unitaires ou de petits groupes homogènes. SwarmCoDe s'inscrit dans la continuité des travaux sur l'évolution morphologique (NEAT, neuroévolution) et des recherches sur les essaims hétérogènes, notamment des groupes comme celui de Josh Bongard à l'Université du Vermont. Les approches concurrentes incluent l'optimisation multi-objectif classique et les frameworks de co-design par gradient. Point critique à noter : l'article ne présente aucune validation sur robots physiques, toutes les métriques étant issues de simulation. Le fossé sim-to-real reste un verrou non adressé dans ce travail, et constituera l'épreuve décisive pour une adoption en contexte industriel.

RecherchePaper

1 source

DC-Ada : adaptation décentralisée des capteurs par récompense seule pour des équipes multi-robots hétérogènes

38

3arXiv cs.RO

DC-Ada : adaptation décentralisée des capteurs par récompense seule pour des équipes multi-robots hétérogènes

Une équipe de chercheurs propose DC-Ada, une méthode d'adaptation décentralisée pour les équipes multi-robots hétérogènes, publiée sur arXiv (2604.03905). Le problème ciblé est concret : lorsqu'un essaim de robots est déployé, les plateformes diffèrent souvent en modalités de capteurs, en champs de vision, en portée, et en modes de défaillance. Un contrôleur entraîné sur une configuration "nominale" se dégrade significativement dès qu'un robot présente des capteurs manquants ou non conformes, même si la tâche reste identique. DC-Ada répond à ce problème en maintenant la politique partagée préentraînée entièrement gelée, et en adaptant uniquement des transformations d'observation compactes, propres à chaque robot, pour les faire correspondre à une interface d'inférence fixe. La méthode est sans gradient et ne nécessite qu'un minimum de communication : elle repose sur une recherche aléatoire accept/refus avec tirage à nombres aléatoires communs, sous un budget strict de 200 000 pas d'environnement joints par run. Les expériences couvrent trois tâches (logistique d'entrepôt, recherche et sauvetage, cartographie collaborative), quatre régimes d'hétérogénéité (H0 à H3) et cinq graines, comparées à quatre baselines. Les résultats offrent une image nuancée qui mérite d'être soulignée : aucune méthode ne domine sur l'ensemble des tâches et métriques. La normalisation d'observation est la plus robuste en termes de récompense pour la logistique d'entrepôt et compétitive en recherche et sauvetage, tandis que la politique gelée sans adaptation donne les meilleures récompenses en cartographie collaborative. DC-Ada se distingue précisément dans les scénarios de cartographie sévère (H3), où il améliore le taux de complétion de mission. Surtout, il n'exige que des retours scalaires d'équipe, sans fine-tuning de politique ni communication persistante entre agents, ce qui le rend utilisable à l'heure du déploiement sans modifier l'infrastructure existante. Ce travail s'inscrit dans une tendance croissante à traiter la robustesse post-déploiement comme un problème distinct de l'entraînement. Les approches concurrentes incluent les méthodes d'adaptation centralisées, le fine-tuning par domaine, et les techniques de transfert sim-to-réel classiques, qui supposent toutes un accès à la politique ou à des gradients. La limite principale de DC-Ada reste son évaluation sur simulateur 2D déterministe uniquement : la validation sur hardware réel avec des capteurs physiquement défaillants reste à démontrer. Les prochaines étapes logiques sont l'extension à des équipes plus larges, des environnements stochastiques, et une évaluation sur des plateformes physiques hétérogènes comme celles que développent des acteurs européens tels que Enchanted Tools ou les écosystèmes ROS2 industriels.

RecherchePaper

1 source

MOSAIC : une autonomie modulaire et évolutive pour la coordination intelligente d'équipes robotiques hétérogènes

36

4arXiv cs.RO

MOSAIC : une autonomie modulaire et évolutive pour la coordination intelligente d'équipes robotiques hétérogènes

Des robots mobiles explorent des environnements hostiles, espace ou zones sinistrées, mais restent aujourd'hui largement dépendants d'un télépilotage humain continu, ce qui limite le nombre de machines déployables et exige une liaison de communication à faible latence quasi permanente. Des chercheurs présentent MOSAIC, un framework d'autonomie scalable pour l'exploration scientifique multi-robots, construit autour d'une abstraction de mission unifiée fondée sur des points d'intérêt (POI) et plusieurs couches d'autonomie, permettant à un seul opérateur de superviser toute une flotte. Le système alloue dynamiquement les tâches d'exploration et de mesure selon les capacités propres de chaque robot, en exploitant la redondance et la spécialisation au niveau de l'équipe pour maintenir l'opération en continu. La validation a eu lieu lors d'une expérience de terrain en environnement analogue spatial, simulant un scénario de prospection lunaire, avec une équipe hétérogène de cinq robots supervisée par un seul opérateur humain. Malgré la défaillance complète d'un des robots en cours de mission, l'équipe a accompli 82,3% des tâches assignées, avec un taux d'autonomie de 86%, tandis que la charge de travail de l'opérateur est restée à 78,2%. Ces résultats comptent parce qu'ils s'attaquent directement au goulot d'étranglement classique des missions robotiques en environnement extrême : la dépendance à la téléopération continue, coûteuse en bande passante et en attention humaine, et fragile dès qu'un délai de communication apparaît (cas typique des missions lunaires ou martiennes). Démontrer qu'une flotte hétérogène peut absorber la panne totale d'un robot et continuer à remplir sa mission sans réallocation manuelle constante est un signal concret pour les intégrateurs travaillant sur la résilience des systèmes multi-robots, que ce soit pour le spatial, la surveillance industrielle ou l'intervention post-catastrophe. Cela illustre aussi une tendance de fond : le report de la charge cognitive du pilotage individuel vers la supervision de mission à haut niveau, un des verrous identifiés depuis longtemps pour faire passer la robotique de terrain de la démonstration à l'opération à grande échelle. Le papier, révisé sur arXiv (version 3, catégorie replace), s'inscrit dans la lignée des recherches en robotique spatiale et en gestion d'équipes multi-robots hétérogènes, un champ où la littérature reste dominée par des simulations ou des tests en petite échelle plutôt que des validations de terrain réalistes. Les auteurs en tirent des enseignements pratiques sur l'interopérabilité entre robots, l'architecture réseau et la composition d'équipe, autant d'éléments destinés à nourrir la conception de futures missions d'exploration multi-robots, sans qu'un calendrier de déploiement opérationnel ne soit pour l'instant annoncé.

RecherchePaper

1 source

Co-GLANCE : perception active sous incertitude pour équipes de robots hétérogènes

À lire aussi

Planification assistée par éclaireur pour équipes de robots hétérogènes en environnements partiellement connus

SwarmCoDe : cadre de co-conception évolutif pour essaims de robots hétérogènes par spéciation dynamique

DC-Ada : adaptation décentralisée des capteurs par récompense seule pour des équipes multi-robots hétérogènes

MOSAIC : une autonomie modulaire et évolutive pour la coordination intelligente d'équipes robotiques hétérogènes