Aller au contenu principal
Point de vue : comment la perspective influence la sociabilité perçue des robots
RecherchearXiv cs.RO2h

Point de vue : comment la perspective influence la sociabilité perçue des robots

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2603.28272v2) une étude expérimentale portant sur la perception de la sociabilité des robots de navigation selon le point de vue de l'observateur. L'équipe a conçu un protocole en réalité virtuelle immersive permettant de soumettre des trajectoires robotiques identiques à trois types de perspectives : allocentrique (vue aérienne, type supervision), égocentrique-proximale (première personne, robot proche) et égocentrique-distale (première personne, robot loin). Deux politiques de navigation distinctes ont été testées pour vérifier si les résultats sont généralisables au-delà d'un seul type de trajectoire. Une variable additionnelle a été introduite : la présence ou l'absence d'un geste de hochement de tête du robot au moment du croisement.

Le résultat central contredit une hypothèse largement répandue dans la communauté : les trajectoires jugées sociables en vue aérienne sont perçues comme significativement plus dérangeantes lorsqu'on les expérimente en première personne et à proximité immédiate. Ce décalage perceptif a des implications directes pour les équipes qui valident des algorithmes de navigation sociale (SFM, ORCA, politiques VLA embarquées) uniquement via simulation ou supervision vidéo. Les benchmarks actuels, qui s'appuient massivement sur des métriques calculées depuis une vue de dessus, risquent de valider des comportements qui resteraient inconfortables sur le terrain réel. L'étude montre également que la distance de dépassement influence le niveau de perturbation ressenti, mais que des signaux sociaux communicatifs, comme le hochement de tête, compensent partiellement cet effet en améliorant la sociabilité perçue, ce qui ouvre une piste concrète pour les robots humanoïdes ou à tête expressive.

Ce travail s'inscrit dans le champ de la navigation socialement consciente (socially aware navigation), actif depuis plus d'une décennie avec des travaux fondateurs sur la proxémique robotique et les espaces personnels. La validation humanoïde en environnement partagé est un enjeu croissant pour des acteurs comme Boston Dynamics, Agility Robotics ou Unitree, dont les robots opèrent déjà dans des entrepôts et espaces semi-publics. Côté européen, des initiatives comme Enchanted Tools (Mirokaï) ou les travaux de l'INRIA sur la navigation sociale font face au même verrou méthodologique pointé ici. La prochaine étape logique serait de valider ces résultats sur du matériel physique en conditions réelles, et d'intégrer des métriques égocentrique dans les pipelines de test standard des politiques de navigation.

Impact France/UE

INRIA et Enchanted Tools (Mirokaï) sont directement exposés au verrou méthodologique identifié : leurs pipelines de validation de navigation sociale reposent sur des métriques allocentriques qui risquent de valider des comportements inconfortables en conditions réelles.

À lire aussi

VibeAct : la vibration comme signal pour la dextérité réactive des robots en contact
1arXiv cs.RO 

VibeAct : la vibration comme signal pour la dextérité réactive des robots en contact

Des chercheurs ont présenté VibeAct, un cadre de manipulation dextère publié sur arXiv en juin 2026, qui intègre des microphones piézoélectriques miniatures dans les doigts d'une main robotique pour détecter les événements de contact et de glissement. La méthode repose sur trois étapes : collecter des données vibro-acoustiques par téléopération, rejouer ces enregistrements dans un jumeau numérique calibré pour étiqueter automatiquement le contact et l'amplitude de glissement par doigt, puis entraîner un estimateur tactile sur les signaux microphone réels. En parallèle, les politiques de manipulation sont entraînées en simulation sur cette même représentation abstraite, et non sur l'audio brut. Le système a été évalué sur cinq tâches riches en contact : re-saisie, réorientation en main et insertion. L'enjeu central est le fossé simulation-réalité qui frappe la manipulation dextère : les événements de contact sont rapides, locaux et souvent masqués visuellement, ce qui rend leur simulation acoustique fidèle quasiment impossible. En découplant l'estimateur tactile, entraîné sur des données réelles, de la politique de contrôle, entraînée en simulation sur la représentation abstraite, le cadre contourne ce verrou sans avoir à modéliser l'audio. Le canal de glissement continu s'avère l'observation la plus informative pour le contrôle réactif soutenu. Sur les cinq tâches, VibeAct surpasse une baseline proprioception et nuage de points, avec les gains les plus nets sur les tâches nécessitant un ajustement continu de la prise. Les politiques apprises se transfèrent à une plateforme physique bras-main dextère, avec une amélioration mesurable des taux de succès. Ce travail s'inscrit dans une compétition dense entre modalités tactiles. Les capteurs à base de caméra comme GelSight ou DIGIT, développé par Meta, offrent une richesse spatiale supérieure mais restent encombrants et coûteux ; les microphones piézoélectriques sont compacts, bon marché et à haute bande passante, mais leur signal est difficile à simuler, d'où l'intérêt du découplage proposé. D'autres travaux exploitent la randomisation de domaine ou des simulations acoustiques approximatives pour tenter de franchir ce seuil. Aucun partenaire industriel ni déploiement commercial n'est annoncé : il s'agit à ce stade de recherche académique. Les prochaines étapes naturelles concernent la généralisation à des objets hors distribution et l'extension à des mains avec davantage de degrés de liberté.

RecherchePaper
1 source
Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive
2arXiv cs.RO 

Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive

Des chercheurs ont déposé sur arXiv (arXiv:2606.02562v1) une méthode algorithmique visant à certifier formellement la sécurité des robots autonomes en interaction avec des humains. Le coeur du travail porte sur le "belief-space safety filter" (BeliefSF), un filtre de sécurité modulaire qui, contrairement aux approches classiques cantonnées à l'espace physique, raisonne simultanément sur la position du robot et sur ses croyances en temps réel concernant l'humain : ses préférences, ses objectifs, sa compétence et sa disposition à coopérer. Pour certifier cette architecture, les auteurs appliquent la prédiction conforme (conformal prediction), une technique statistique qui produit des garanties de sécurité à haute probabilité tout en tenant explicitement compte des erreurs d'inférence et d'approximation neuronale. La validation est réalisée sur un benchmark simulé d'interaction humain-véhicule, où le filtre certifié s'avère significativement moins conservatif qu'une baseline conformal prediction standard. L'enjeu industriel est direct : dans les scénarios de cobotique, de robots de livraison ou de véhicules autonomes partageant l'espace avec des piétons, les filtres de sécurité trop conservatifs dégradent l'efficacité opérationnelle et rendent le déploiement économiquement non viable. La difficulté jusqu'ici résidait dans le "curse of dimensionality" des espaces de croyance : plus le robot modélise finement l'incertitude humaine, plus l'espace d'état explose, rendant les garanties formelles quasi impossibles sans approximation neuronale coûteuse en fiabilité. En focalisant la vérification sur les régions où l'inférence est statistiquement fiable, les auteurs contournent cette contrainte sans alourdir la complexité d'échantillonnage, ce qui constitue une avancée méthodologique notable pour les intégrateurs cherchant des certifications de sécurité fonctionnelle (ISO 13849, IEC 62061). Le BeliefSF a été introduit comme concept dans des travaux antérieurs, mais sans garanties formelles exploitables, ce qui en limitait la portée au stade de la démonstration académique. Ce preprint comble ce manque en s'appuyant sur la prédiction conforme, une technique qui gagne rapidement du terrain dans la vérification de systèmes apprenants, notamment après des travaux récents de groupes comme MIT CSAIL et Stanford sur les Control Barrier Functions (CBF) à base de données. La prochaine étape critique reste la validation sur hardware réel, en dehors de la simulation, pour évaluer si les garanties tiennent face aux bruits capteurs et aux latences d'inférence propres au déploiement physique. Aucun partenaire industriel ni calendrier de transfert n'est mentionné dans ce preprint.

UECette méthode de certification formelle pourrait faciliter la conformité aux normes européennes de sécurité fonctionnelle (ISO 13849, IEC 62061) pour les intégrateurs de cobots et robots autonomes en Europe, sous réserve de validation hardware réelle.

RechercheOpinion
1 source
RoboMD : détecter les vulnérabilités des robots par champs de potentiel sémantique
3arXiv cs.RO 

RoboMD : détecter les vulnérabilités des robots par champs de potentiel sémantique

Des chercheurs ont publié RoboMD (arXiv:2412.02818v4), un framework destiné à identifier automatiquement les vulnérabilités des politiques de manipulation robotique avant tout déploiement physique coûteux. La méthode repose sur l'entraînement d'une politique de deep reinforcement learning distincte, chargée non pas d'exécuter une tâche, mais de prédire les scénarios d'échec. Cette politique évolue dans un espace d'embeddings vision-langage continu, traité comme un champ de potentiel : elle se déplace vers les régions associées à des échecs et se fait repousser par les zones de succès. Entraîné sur des rollouts virtuels avec un volume limité de données succès/échec, le système génère une carte probabiliste de vraisemblance de vulnérabilité. Sur des benchmarks de simulation et sur un bras robotique physique, RoboMD découvre jusqu'à 23 % de vulnérabilités uniques supplémentaires par rapport aux meilleures baselines VLA (Vision-Language-Action) existantes, révélant des fragilités subtiles ignorées par les approches heuristiques classiques. Les auteurs montrent également que le fine-tuning de la politique de manipulation avec les scénarios adverses découverts améliore les performances avec nettement moins de données d'entraînement. L'enjeu principal est l'écart entre les performances en laboratoire et la robustesse réelle des politiques de manipulation, un angle mort critique alors que les déploiements de robots physiques s'accélèrent. Tester manuellement les variations d'environnement (éclairage, objets partiellement occultés, perturbations contextuelles) en conditions réelles reste prohibitif en coût et en risque. RoboMD propose une alternative scalable : explorer systématiquement l'espace sémantique des configurations problématiques sans mobiliser le hardware. La carte de vraisemblance produite est directement exploitable par un intégrateur ou un responsable qualité pour prioriser les correctifs avant mise en production, ce qui représente un changement de paradigme par rapport aux tests de robustesse ad hoc actuellement pratiqués dans l'industrie. Ce travail s'inscrit dans un mouvement plus large d'évaluation adversariale des politiques incarnées, alors que des modèles comme pi0 (Physical Intelligence), GR00T N2 (NVIDIA) ou les politiques d'OpenVLA cherchent à généraliser le contrôle robotique via des architectures VLA. La difficulté de tester exhaustivement ces modèles en conditions réelles est l'un des principaux freins à leur adoption industrielle. RoboMD adresse ce goulot d'étranglement par l'angle de la sécurité et de la qualification, plutôt que par la seule performance brute. La version 4 du preprint suggère que les auteurs intègrent des retours communautaires ; aucun déploiement commercial ni partenariat industriel n'est annoncé à ce stade, ce qui reste un résultat de recherche à reproduire sur des plateformes humanoïdes ou AMR à plus grande échelle.

RechercheOpinion
1 source
Héritage lamarckien en environnements dynamiques : comment les variables clés influencent la dynamique évolutive
4arXiv cs.RO 

Héritage lamarckien en environnements dynamiques : comment les variables clés influencent la dynamique évolutive

Une équipe de chercheurs en robotique évolutionnaire a publié en mai 2025 sur arXiv (2605.15769) une étude clarifiant les conditions dans lesquelles l'héritage lamarckien améliore ou dégrade les performances d'un système de co-optimisation corps-cerveau. L'expérience repose sur des robots mous virtuels dont la morphologie évolue par algorithme évolutionnaire, tandis que le contrôleur est optimisé en cours de vie par apprentissage, soit par optimisation bayésienne, soit par apprentissage par renforcement. L'héritage lamarckien consiste ici à transférer directement les paramètres de contrôle appris par un parent à sa descendance, à la différence de l'héritage darwinien classique qui ne transmet que le génome structurel. Les auteurs font varier deux dimensions de l'environnement dynamique : le niveau de conflit entre les changements environnementaux et le comportement optimal du robot, et la prévisibilité de ces changements pour l'agent. Résultat : l'héritage lamarckien n'est inférieur à l'approche darwinienne que dans le seul cas où les changements sont à la fois conflictuels et imprévisibles. L'ajout d'un capteur permettant de détecter les transitions environnementales restaure les bénéfices lamarckiens même dans les environnements conflictuels, en donnant à l'agent les moyens d'anticiper un changement de comportement nécessaire. Ce résultat réconcilie une littérature jusque-là contradictoire. La théorie évolutionnaire classique considère l'héritage lamarckien comme neutre ou négatif à long terme, tandis que plusieurs travaux récents en robotique évolutionnaire rapportaient des gains de performance. Cette étude suggère que les comparaisons précédentes omettaient de contrôler conjointement la conflictualité et la prévisibilité des perturbations, deux variables qui interagissent de façon non-linéaire. Pour les praticiens du morpho-evolution, domaine qui cherche à co-optimiser forme et contrôle pour des robots adaptatifs industriels ou de terrain, cela pose un cadre d'analyse actionnable : le bon mécanisme d'héritage dépend du profil statistique de l'environnement opérationnel, pas d'un choix dogmatique. La co-optimisation morphologie-contrôleur est un problème ouvert depuis les travaux fondateurs de Karl Sims dans les années 1990, et reste un défi majeur en conception de robots autonomes. La robotique douce (soft robotics) sert ici de banc d'essai car ses espaces morphologiques continus amplifient la sensibilité aux stratégies d'héritage. Ce preprint n'est pas encore évalué par les pairs et les résultats reposent exclusivement sur simulation, le transfert sim-to-real reste à démontrer. Parmi les acteurs qui travaillent sur des approches similaires figurent des laboratoires comme le Vermont Complex Systems Center ou le groupe Kriegman, ainsi que des initiatives industrielles en conception générative de robots. La prochaine étape naturelle est une validation sur morphologies physiques dans des environnements dont les statistiques sont connues et contrôlées.

RecherchePaper
1 source