Aller au contenu principal
Robot Talk, épisode 159 : captation sensorielle et manipulation robotique, avec Maria Koskinopoulou
RechercheRobohub1h

Robot Talk, épisode 159 : captation sensorielle et manipulation robotique, avec Maria Koskinopoulou

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Maria Koskinopoulou, maître de conférences en robotique et vision par ordinateur à l'université Heriot-Watt (Édimbourg), était l'invitée du 159e épisode du podcast Robot Talk animé par Claire Asher. Co-directrice de l'ARM²Lab (Autonomous Robotic Manipulation and Multi-Agent Systems Lab) au sein du National Robotarium britannique, aux côtés d'Ignacio Carlucho, elle y présente ses travaux sur la manipulation robotique autonome appliquée à la chirurgie, à l'industrie manufacturière et à des domaines émergents comme la robotique sous-marine et le tri de déchets. Ses projets sont financés par le UKRI (UK Research and Innovation) et des programmes européens, sans que des montants ou des échéances précises ne soient communiqués dans cet épisode.

L'intérêt de ces travaux réside dans la convergence de plusieurs verrous technologiques : perception visuelle embarquée, interaction homme-robot, et apprentissage automatique appliqué à des environnements non structurés. La robotique chirurgicale et le tri autonome de déchets représentent deux cas d'usage où le gap sim-to-real reste un obstacle majeur, et où les approches multi-agents peuvent offrir une redondance opérationnelle pertinente pour les intégrateurs industriels.

Le National Robotarium, inauguré en 2022 à Édimbourg avec un financement de 22,4 millions de livres sterling du gouvernement écossais et de Heriot-Watt University, positionne le Royaume-Uni comme acteur de premier plan en robotique appliquée post-Brexit. L'ARM²Lab s'inscrit dans un écosystème concurrentiel où des laboratoires comme le Dynamic Robot Systems Group d'Oxford ou le LIRMM en France travaillent sur des problématiques similaires. Cet épisode reste une présentation de recherche académique en cours, sans annonce de produit ni de déploiement commercial.

Impact France/UE

Les travaux de l'ARM²Lab bénéficient de financements de programmes européens et s'inscrivent dans un écosystème de recherche en manipulation autonome que partagent des laboratoires français comme le LIRMM, sans déploiement commercial ni impact direct sur le marché européen.

Dans nos dossiers

À lire aussi

Robot Talk, épisode 154 : la navigation visuelle chez les insectes et les robots, avec Andrew Philippides
1Robohub 

Robot Talk, épisode 154 : la navigation visuelle chez les insectes et les robots, avec Andrew Philippides

Andrew Philippides, professeur de biorobotique à l'Université du Sussex (Royaume-Uni), mène des travaux à l'intersection de la biologie expérimentale, de la robotique et du machine learning pour décoder les mécanismes de navigation visuelle chez les insectes sociaux. Co-directeur du Centre for Computational Neuroscience and Robotics et du programme doctoral be.AI (financé par le Leverhulme Trust), il étudie spécifiquement comment les fourmis et les abeilles parviennent à se repérer et à apprendre des trajectoires complexes avec un cerveau de quelques milliers de neurones seulement. L'enjeu pour la robotique mobile est direct : les algorithmes de navigation actuels (SLAM, odométrie visuelle) restent coûteux en calcul et fragiles face aux environnements non structurés. Les insectes, eux, résolvent ce problème avec une efficacité énergétique et computationnelle hors norme. Comprendre ces mécanismes permet de concevoir des algorithmes bioinspiré légers, potentiellement déployables sur des robots à ressources contraintes, drones miniatures, robots agricoles autonomes, robots d'inspection en milieu dégradé. Les travaux de Philippides s'inscrivent dans un courant de recherche en pleine expansion qui inclut des équipes comme celle d'Antoine Wystrach (CNRS Toulouse) sur la navigation des fourmis, ou les projets de robotique neuromorphique portés par Intel (Loihi) et l'Université de Zurich. Le groupe du Sussex collabore avec des biologistes comportementaux pour valider les modèles sur terrain réel, limitant ainsi le sim-to-real gap qui affecte nombre d'approches purement computationnelles. Les prochaines étapes annoncées portent sur l'intégration de ces algorithmes dans des plateformes robotiques embarquées.

UELes travaux d'Antoine Wystrach au CNRS Toulouse sur la navigation des fourmis s'inscrivent directement dans ce courant de recherche bioinspiré, positionnant la France comme contributeur actif à la conception d'algorithmes de navigation légers pour drones agricoles et robots d'inspection.

RecherchePaper
1 source
RoboEval : un cadre structuré et extensible pour évaluer la manipulation robotique
2arXiv cs.RO 

RoboEval : un cadre structuré et extensible pour évaluer la manipulation robotique

Une équipe de chercheurs a publié RoboEval (arXiv:2507.00435), un cadre d'évaluation structuré et un benchmark dédié à la manipulation robotique. L'outil propose huit tâches bimanuelles assorties de variantes systématiquement contrôlées, plus de trois mille démonstrations expertes, et une plateforme de simulation modulaire conçue pour garantir la reproductibilité des expériences. Chaque tâche est instrumentée avec des métriques standardisées couvrant l'efficacité d'exécution, la coordination entre les deux bras, et la stabilité ou sécurité du mouvement. Le cadre inclut également des mesures de progression par étapes qui permettent de localiser précisément où et pourquoi une politique échoue, plutôt que de simplement enregistrer un échec global. Les expériences ont été conduites sur des politiques visuomotrices de l'état de l'art, en évaluant la stabilité des métriques face aux variations de conditions et leur pouvoir discriminant entre politiques affichant des taux de succès similaires. L'enjeu est méthodologique autant qu'industriel. Aujourd'hui, la majorité des benchmarks de manipulation robotique réduisent la performance à un comptage binaire succès/échec, ce qui efface les différences réelles de qualité d'exécution. Deux politiques peuvent afficher le même taux de réussite tout en présentant des comportements radicalement différents en termes de fluidité, de robustesse aux perturbations, ou de coordination interdigitale. Pour un intégrateur ou un décideur industriel qui doit choisir entre plusieurs VLA (Vision-Language-Action policies) pour déployer un robot en production, cette granularité est critique. RoboEval tente de combler ce fossé en fournissant des métriques intermédiaires qui corrèlent avec le succès final mais révèlent aussi la structure des défaillances, un prérequis pour itérer efficacement sur l'entraînement. Ce travail s'inscrit dans une dynamique plus large de maturation de l'évaluation en robotique apprenable, un domaine qui souffre depuis des années d'une fragmentation des protocoles. Des initiatives comparables comme LIBERO ou RoboVerse ont tenté de standardiser les conditions expérimentales, mais restaient souvent limitées aux tâches unimanuelles ou aux métriques de haut niveau. RoboEval se distingue par son focus bimanuel, directement pertinent pour les applications industrielles d'assemblage ou de logistique, et par la richesse de ses métriques comportementales. La page projet est accessible sur robo-eval.github.io. Aucun partenariat industriel ni calendrier de déploiement n'est mentionné : il s'agit pour l'instant d'une contribution académique, sans validation en environnement réel annoncée.

UEContribution académique ouverte utilisable par tout labo ou intégrateur européen souhaitant évaluer et comparer des politiques VLA bimanuelles sans dépendre de benchmarks propriétaires.

RecherchePaper
1 source
Robot Talk, épisode 153 : des robots inspirés de l'origami, avec Chenying Liu
3Robohub 

Robot Talk, épisode 153 : des robots inspirés de l'origami, avec Chenying Liu

Chenying Liu, Junior Research Fellow et Associate Member of Faculty au Department of Engineering Science de l'Université d'Oxford, était l'invitée du 153e épisode du podcast Robot Talk pour présenter ses travaux sur l'intelligence physique incarnée (embodied physical intelligence). Sa recherche explore comment la forme physique d'un robot peut activement contribuer à la perception, au traitement de l'information, à la prise de décision et au mouvement, en s'inspirant notamment des principes géométriques de l'origami. L'épisode ne communique pas de métriques techniques précises, pas de charges utiles, de degrés de liberté ni de résultats expérimentaux chiffrés, ce qui le situe davantage dans la vulgarisation académique que dans l'annonce produit. L'approche d'Oxford que défend Liu représente un contrepoids notable au paradigme dominant du tout-logiciel : plutôt que de déléguer l'intelligence uniquement aux modèles de fondation et aux VLA (Vision-Language-Action models), l'idée est d'intégrer la computation directement dans la géométrie et les matériaux du robot. Cette co-conception mécanique-contrôle promet des systèmes plus robustes et plus efficaces en énergie, particulièrement pertinents pour des environnements non structurés où les modèles sim-to-real peinent encore. Ce courant de recherche, parfois appelé morphological computation ou soft robotics computationnelle, est actif dans plusieurs laboratoires mondiaux, MIT CSAIL, ETH Zurich, EPFL, ainsi qu'en France au CNRS LIRMM et à l'INRIA. Oxford se positionne ici via une chercheuse indépendante dont le programme, encore jeune, n'a pas encore de partenaires industriels publiquement annoncés. La prochaine étape naturelle serait une publication de résultats expérimentaux ou un prototype démontrant le gain d'autonomie promis par cette philosophie de conception.

UELe CNRS LIRMM et l'INRIA sont cités comme acteurs du courant de computation morphologique, mais l'épisode de podcast n'a pas d'impact opérationnel direct sur l'écosystème français.

RecherchePaper
1 source
Modèle de diffusion adaptatif pour la manipulation robotique efficace (VADF)
4arXiv cs.RO 

Modèle de diffusion adaptatif pour la manipulation robotique efficace (VADF)

Une équipe de chercheurs a publié sur arXiv (référence 2604.15938) une proposition architecturale baptisée VADF (Vision-Adaptive Diffusion Policy Framework), visant à corriger deux défauts structurels des politiques de diffusion appliquées à la manipulation robotique. Le premier défaut est le déséquilibre de classe dû à l'échantillonnage uniforme lors de l'entraînement : le modèle traite indistinctement les exemples faciles et difficiles, ce qui ralentit la convergence. Le second est le taux d'échec à l'inférence par dépassement de délai, un problème opérationnel concret dès qu'on sort du laboratoire. VADF intègre deux composants : l'ALN (Adaptive Loss Network), un MLP léger qui prédit en temps réel la difficulté de chaque pas d'entraînement et applique un suréchantillonnage des régions à forte perte via du hard negative mining ; et l'HVTS (Hierarchical Vision Task Segmenter), qui décompose une instruction de haut niveau en sous-tâches visuellement guidées, en assignant des schedules de bruit courts aux actions simples et des schedules longs aux actions complexes, réduisant ainsi la charge computationnelle à l'inférence. L'architecture est conçue model-agnostic, c'est-à-dire intégrable à n'importe quelle implémentation existante de politique de diffusion. L'intérêt pour un intégrateur ou un responsable R&D est avant tout pratique : les politiques de diffusion souffrent de coûts d'entraînement élevés et d'une fiabilité insuffisante en déploiement réel, ce qui freine leur adoption industrielle. Si les gains annoncés par VADF se confirment sur des benchmarks indépendants, la réduction des étapes de convergence représenterait un levier significatif sur les coûts GPU, et la diminution des timeouts à l'inférence améliorerait directement la cadence opérationnelle. Il faut toutefois noter que ce travail est un preprint non évalué par des pairs, sans chiffres de performance comparatifs publiés dans l'article lui-même. Les politiques de diffusion ont émergé comme méthode de choix pour l'imitation comportementale en robotique depuis les travaux de Chi et al. en 2023 (Diffusion Policy, Columbia), avant d'être intégrées dans des architectures plus larges comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. La principale tension du domaine reste le sim-to-real gap et la robustesse à l'inférence en conditions réelles, terrain sur lequel VADF prétend apporter une contribution. Les prochaines étapes logiques seraient une validation sur des benchmarks standard (RLBench, LIBERO) et une comparaison directe avec ACT ou Diffusion Policy de référence.

RecherchePaper
1 source