Aller au contenu principal
Robot Talk, épisode 154 : la navigation visuelle chez les insectes et les robots, avec Andrew Philippides
RechercheRobohub6sem

Robot Talk, épisode 154 : la navigation visuelle chez les insectes et les robots, avec Andrew Philippides

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Andrew Philippides, professeur de biorobotique à l'Université du Sussex (Royaume-Uni), mène des travaux à l'intersection de la biologie expérimentale, de la robotique et du machine learning pour décoder les mécanismes de navigation visuelle chez les insectes sociaux. Co-directeur du Centre for Computational Neuroscience and Robotics et du programme doctoral be.AI (financé par le Leverhulme Trust), il étudie spécifiquement comment les fourmis et les abeilles parviennent à se repérer et à apprendre des trajectoires complexes avec un cerveau de quelques milliers de neurones seulement.

L'enjeu pour la robotique mobile est direct : les algorithmes de navigation actuels (SLAM, odométrie visuelle) restent coûteux en calcul et fragiles face aux environnements non structurés. Les insectes, eux, résolvent ce problème avec une efficacité énergétique et computationnelle hors norme. Comprendre ces mécanismes permet de concevoir des algorithmes bioinspiré légers, potentiellement déployables sur des robots à ressources contraintes, drones miniatures, robots agricoles autonomes, robots d'inspection en milieu dégradé.

Les travaux de Philippides s'inscrivent dans un courant de recherche en pleine expansion qui inclut des équipes comme celle d'Antoine Wystrach (CNRS Toulouse) sur la navigation des fourmis, ou les projets de robotique neuromorphique portés par Intel (Loihi) et l'Université de Zurich. Le groupe du Sussex collabore avec des biologistes comportementaux pour valider les modèles sur terrain réel, limitant ainsi le sim-to-real gap qui affecte nombre d'approches purement computationnelles. Les prochaines étapes annoncées portent sur l'intégration de ces algorithmes dans des plateformes robotiques embarquées.

Impact France/UE

Les travaux d'Antoine Wystrach au CNRS Toulouse sur la navigation des fourmis s'inscrivent directement dans ce courant de recherche bioinspiré, positionnant la France comme contributeur actif à la conception d'algorithmes de navigation légers pour drones agricoles et robots d'inspection.

À lire aussi

Robot Talk, épisode 153 : des robots inspirés de l'origami, avec Chenying Liu
1Robohub 

Robot Talk, épisode 153 : des robots inspirés de l'origami, avec Chenying Liu

Chenying Liu, Junior Research Fellow et Associate Member of Faculty au Department of Engineering Science de l'Université d'Oxford, était l'invitée du 153e épisode du podcast Robot Talk pour présenter ses travaux sur l'intelligence physique incarnée (embodied physical intelligence). Sa recherche explore comment la forme physique d'un robot peut activement contribuer à la perception, au traitement de l'information, à la prise de décision et au mouvement, en s'inspirant notamment des principes géométriques de l'origami. L'épisode ne communique pas de métriques techniques précises, pas de charges utiles, de degrés de liberté ni de résultats expérimentaux chiffrés, ce qui le situe davantage dans la vulgarisation académique que dans l'annonce produit. L'approche d'Oxford que défend Liu représente un contrepoids notable au paradigme dominant du tout-logiciel : plutôt que de déléguer l'intelligence uniquement aux modèles de fondation et aux VLA (Vision-Language-Action models), l'idée est d'intégrer la computation directement dans la géométrie et les matériaux du robot. Cette co-conception mécanique-contrôle promet des systèmes plus robustes et plus efficaces en énergie, particulièrement pertinents pour des environnements non structurés où les modèles sim-to-real peinent encore. Ce courant de recherche, parfois appelé morphological computation ou soft robotics computationnelle, est actif dans plusieurs laboratoires mondiaux, MIT CSAIL, ETH Zurich, EPFL, ainsi qu'en France au CNRS LIRMM et à l'INRIA. Oxford se positionne ici via une chercheuse indépendante dont le programme, encore jeune, n'a pas encore de partenaires industriels publiquement annoncés. La prochaine étape naturelle serait une publication de résultats expérimentaux ou un prototype démontrant le gain d'autonomie promis par cette philosophie de conception.

UELe CNRS LIRMM et l'INRIA sont cités comme acteurs du courant de computation morphologique, mais l'épisode de podcast n'a pas d'impact opérationnel direct sur l'écosystème français.

RecherchePaper
1 source
Robot Talk, épisode 159 : captation sensorielle et manipulation robotique, avec Maria Koskinopoulou
2Robohub 

Robot Talk, épisode 159 : captation sensorielle et manipulation robotique, avec Maria Koskinopoulou

Maria Koskinopoulou, maître de conférences en robotique et vision par ordinateur à l'université Heriot-Watt (Édimbourg), était l'invitée du 159e épisode du podcast Robot Talk animé par Claire Asher. Co-directrice de l'ARM²Lab (Autonomous Robotic Manipulation and Multi-Agent Systems Lab) au sein du National Robotarium britannique, aux côtés d'Ignacio Carlucho, elle y présente ses travaux sur la manipulation robotique autonome appliquée à la chirurgie, à l'industrie manufacturière et à des domaines émergents comme la robotique sous-marine et le tri de déchets. Ses projets sont financés par le UKRI (UK Research and Innovation) et des programmes européens, sans que des montants ou des échéances précises ne soient communiqués dans cet épisode. L'intérêt de ces travaux réside dans la convergence de plusieurs verrous technologiques : perception visuelle embarquée, interaction homme-robot, et apprentissage automatique appliqué à des environnements non structurés. La robotique chirurgicale et le tri autonome de déchets représentent deux cas d'usage où le gap sim-to-real reste un obstacle majeur, et où les approches multi-agents peuvent offrir une redondance opérationnelle pertinente pour les intégrateurs industriels. Le National Robotarium, inauguré en 2022 à Édimbourg avec un financement de 22,4 millions de livres sterling du gouvernement écossais et de Heriot-Watt University, positionne le Royaume-Uni comme acteur de premier plan en robotique appliquée post-Brexit. L'ARM²Lab s'inscrit dans un écosystème concurrentiel où des laboratoires comme le Dynamic Robot Systems Group d'Oxford ou le LIRMM en France travaillent sur des problématiques similaires. Cet épisode reste une présentation de recherche académique en cours, sans annonce de produit ni de déploiement commercial.

UELes travaux de l'ARM²Lab bénéficient de financements de programmes européens et s'inscrivent dans un écosystème de recherche en manipulation autonome que partagent des laboratoires français comme le LIRMM, sans déploiement commercial ni impact direct sur le marché européen.

RecherchePaper
1 source
VGP-Nav : perception géométrique visuelle adaptée aux métriques pour la navigation robotique
3arXiv cs.RO 

VGP-Nav : perception géométrique visuelle adaptée aux métriques pour la navigation robotique

Une équipe de chercheurs a présenté en juin 2026 VGP-Nav (arXiv:2606.09268), un cadre unifié permettant à un robot mobile de se localiser avec précision et de détecter des obstacles avec cohérence métrique en n'utilisant qu'une seule caméra RGB monoculaire standard. Contrairement aux systèmes de navigation conventionnels qui combinent caméras et capteurs actifs comme le LiDAR pour obtenir des mesures métriques fiables, VGP-Nav s'appuie exclusivement sur la vision monoculaire. L'architecture ancre la géométrie visuelle à des contraintes d'échelle physiquement significatives extraites de la géométrie du plan sol, ce qui permet de résoudre en ligne l'ambiguïté d'échelle inhérente à tout système monoculaire. Les expériences présentées couvrent des environnements variés et incluent un déploiement validé sur des robots mobiles réels. L'ambiguïté d'échelle est l'un des obstacles fondamentaux à la navigation monoculaire : une caméra seule ne peut pas distinguer un objet proche et petit d'un objet lointain et grand sans référence externe. Les approches classiques contournent ce problème avec du LiDAR (coûteux, encombrant, nécessitant une calibration spatio-temporelle complexe entre capteurs) ou des centrales inertielles, ce qui augmente le coût et la complexité des déploiements, notamment pour les flottes d'AMR en logistique ou en industrie. Si VGP-Nav tient ses promesses à l'échelle, il ouvre la voie à des robots mobiles autonomes basse consommation capables de naviguer en sécurité dans des environnements non structurés sans infrastructure sensorielle lourde, un enjeu critique pour les intégrateurs cherchant à réduire le coût total de possession. La navigation purement visuelle fait l'objet d'intenses recherches depuis la première génération de systèmes SLAM monoculaires comme ORB-SLAM (2015), mais la cohérence métrique restait leur talon d'Achille face au LiDAR. Des approches récentes basées sur la profondeur monoculaire apprise, Depth Anything, UniDepth, ou des architectures de localisation neuronale cherchent à combler cet écart, tandis que des acteurs comme Nvidia (Isaac Perceptor), Clearpath Robotics ou Slamtec intègrent progressivement davantage de vision dans leurs pipelines de navigation pour AMR. VGP-Nav reste à ce stade une contribution de recherche en pré-print : sa validité industrielle n'est pas encore confirmée par des benchmarks tiers indépendants sur des datasets standardisés comme nuScenes ou ScanNet, et aucun partenariat commercial ni calendrier de transfert technologique n'est annoncé.

UEPotentiel indirect pour les intégrateurs AMR européens si la technologie est validée industriellement, aucun partenariat commercial ni transfert vers l'Europe n'est annoncé à ce stade.

RecherchePaper
1 source
Co-entraînement avec vidéo égocentrique et démonstration pour la navigation robotique
4arXiv cs.RO 

Co-entraînement avec vidéo égocentrique et démonstration pour la navigation robotique

Des chercheurs ont publié sur arXiv (réf. 2606.01951) un cadre d'apprentissage par imitation pour robots mobiles qui exploite des vidéos égocentrées tournées par des humains en train de marcher. Le principe : estimer le mouvement de la caméra à partir de ces séquences piétonnes, puis convertir ce flux en représentations d'actions compatibles avec des robots mobiles au sol. Un modèle VLA (Vision-Language-Action) est ensuite entraîné conjointement sur ces données dérivées de vidéos humaines et sur des trajectoires collectées directement par le robot. Les expériences portent sur une tâche de navigation avec recherche de fruits, où le robot doit localiser des objets cibles dans un environnement non structuré en suivant des instructions en langage naturel. L'intérêt de cette approche réside dans sa réponse au principal goulot d'étranglement de la robotique apprise : la collecte de données sur robot réel est coûteuse, lente, et difficilement scalable. Si recycler des vidéos égocentrées humaines pour l'apprentissage de tâches de manipulation existe déjà dans la littérature (notamment via des datasets comme EPIC-Kitchens ou des pipelines type ACT), l'étendre à la navigation mobile reste difficile car les changements de point de vue lors de la locomotion créent des discontinuités que les modèles de manipulation ne rencontrent pas. Les résultats montrent que l'entraînement conjoint dépasse les deux sources de données prises isolément, aussi bien en compréhension du langage qu'en robustesse de génération d'actions. Cela valide partiellement l'hypothèse que le sim-to-human-video-to-real peut fonctionner pour la navigation, sans simulation physique. Ce travail s'inscrit dans une course plus large à la scalabilité des données pour les VLA, où des acteurs comme Physical Intelligence (pi0), Google DeepMind (RT-2, GR00T N2 pour Nvidia) ou Boston Dynamics cherchent des pipelines moins dépendants de la téléopération humaine sur robot. La navigation mobile reste moins couverte que la manipulation dans cette littérature, et ce papier ouvre une voie de co-training à moindre coût. Les prochaines étapes naturelles seraient d'évaluer la généralisation à des environnements plus complexes, de mesurer le ratio optimal données humaines/données robot, et de tester sur des plateformes AMR commerciales. Le code et les datasets ne sont pas encore publiés au moment de la soumission arXiv.

RechercheOpinion
1 source