
HiCrowd : alignement hiérarchique du flux de foule pour les environnements humains denses
Des chercheurs ont publié HiCrowd (arXiv:2602.05608, troisième révision), un framework hiérarchique conçu pour permettre aux robots mobiles de naviguer dans des foules piétonnes denses sans se bloquer. L'architecture combine une politique d'apprentissage par renforcement (RL) à haut niveau, qui génère un "follow point" vers un groupe de piétons compatible, et un contrôleur prédictif par modèle (MPC) à bas niveau chargé du suivi sécurisé à horizon court. La méthode a été évaluée en mode offline (rejeu de trajectoires humaines enregistrées) et en mode online (simulation où les piétons réagissent au robot), puis déployée dans un musée public et sur le site de l'Expo 2025 Osaka, sans réentraînement spécifique à ces environnements.
Le résultat central est la réduction substantielle du "freezing robot problem", phénomène où le robot, incapable de trouver un couloir sécurisé, se retrouve immobile au milieu de la foule. Ce blocage est l'un des principaux obstacles au déploiement d'AMR (autonomous mobile robots) en milieu public. HiCrowd surpasse les baselines réactives classiques et les approches purement par apprentissage sur deux métriques clés : efficacité de navigation et sécurité. Le déploiement à l'Expo 2025 Osaka sans réentraînement apporte un argument de robustesse sim-to-real qui mérite d'être noté, même si les auteurs ne publient pas de métriques quantitatives de terrain. La contribution conceptuelle est un changement de paradigme : traiter les piétons comme un flux à aligner plutôt que comme des obstacles dynamiques à esquiver ouvre une voie différente des approches ORCA ou CADRL dominantes.
La navigation sociale robotique est un domaine compétitif depuis une décennie, avec des méthodes allant de Dynamic Window Approach aux réseaux de graphes attentionnels (SARL, CrowdNav) et aux approches POMDP. HiCrowd se positionne dans la lignée des hybrides RL+MPC, qui cherchent à concilier la prise de décision à long terme et la sécurité temps-réel. Le code et les démonstrations sont disponibles sur GitHub. La v3 de l'article suggère une soumission en cours vers une conférence de robotique majeure (ICRA ou IROS). Les prochaines étapes naturelles seraient une validation sur des robots commerciaux (Boston Dynamics Spot, Clearpath) et des métriques de confort social mesurées auprès des piétons réels.
Dans nos dossiers




