FR/EU ecosystemearXiv cs.RO3h

Voir et Bifurquer : branchement par vision pour la programmation interactive de compétences robotiques

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe du CIIRC (Czech Institute of Informatics, Robotics and Cybernetics, Prague) publie sur arXiv un framework appelé See & Switch, qui étend la programmation par démonstration (PbD) aux tâches robotiques conditionnelles basées sur la vision. Le système représente une tâche comme un graphe de segments de compétence reliés par des états de décision : lors de l'exécution, un module appelé Switcher analyse les images d'une caméra embarquée dans la main (eye-in-hand) pour sélectionner la branche à suivre ou signaler une situation inconnue nécessitant une nouvelle démonstration. En cas d'erreur ou de cas imprévu, l'opérateur peut intervenir via enseignement kinesthésique, joystick ou gestes manuels. Le système a été évalué sur trois tâches de manipulation dextère impliquant 8 utilisateurs novices, pour un total d'environ 900 séquences d'exécution sur robot réel. Les résultats mesurés sur des fenêtres temporelles définies par l'utilisateur atteignent 90,6 % de précision dans la sélection de branche, et une détection d'anomalies supérieure à 90 % dans 47 des 79 états de décision testés.

Ces résultats sont pertinents pour les intégrateurs industriels qui cherchent à déployer la PbD dans des environnements variables sans passer par la programmation explicite de chaque variante. Le principal verrou du secteur est que les systèmes PbD classiques supposent un environnement fixe : un changement de disposition, d'orientation de pièce ou de contexte casse le programme. See & Switch traite ce problème au niveau du graphe de tâche plutôt qu'au niveau du modèle de perception, ce qui le rend modulaire et extensible sans réentraîner un réseau complet. La nuance importante : les performances de branchement sont évaluées en mode offline sur des fenêtres déjà identifiées, ce qui isole le classificateur visuel des erreurs de timing réelles, les chiffres de 90 % ne reflètent donc pas directement la robustesse end-to-end en déploiement non supervisé.

La PbD a connu un regain d'intérêt fort depuis 2022 avec les approches VLA (Vision-Language-Action) portées par des systèmes comme Pi-0 (Physical Intelligence), OpenVLA ou ACT (Action Chunking with Transformers). See & Switch se positionne différemment : il n'utilise pas de grand modèle pré-entraîné mais une architecture légère et interprétable, orientée vers l'enseignement interactif sur site par du personnel non expert. Les travaux proviennent du groupe ImitRob au CIIRC, qui publie régulièrement sur la PbD depuis plusieurs années. Le code et les données sont disponibles publiquement. La prochaine étape logique serait de coupler ce graphe de décision avec un backbone de perception plus robuste, ou de tester la scalabilité sur des cellules industrielles multi-postes.

Impact France/UE

Le framework See & Switch, issu du groupe ImitRob au CIIRC de Prague (UE), est publié en open source et ne requiert pas de grand modèle pré-entraîné, ce qui le rend directement accessible aux intégrateurs industriels européens souhaitant déployer la programmation par démonstration dans des environnements variables sans expertise en deep learning.

Dans nos dossiers

Physical Intelligence — π0 OpenVLA / RT-X arXiv cs.RO

À lire aussi

1arXiv cs.RO

TAVIS : un benchmark pour la vision active égocentrique et le regard anticipateur en apprentissage par imitation

Une équipe de chercheurs a publié TAVIS, un environnement d'évaluation standardisé pour comparer les approches de vision active en apprentissage par imitation, soit la capacité d'une politique robotique à contrôler son propre regard pendant une tâche de manipulation. Le benchmark comprend deux suites : TAVIS-Head (5 tâches avec caméra sur cardan pan/tilt pour la recherche globale de scène) et TAVIS-Hands (3 tâches avec caméras de poignet pour gérer les occlusions locales). Il est construit sur IsaacLab et s'appuie sur deux embodiments de torse humanoïde : le GR1T2 de Fourier Intelligence et le Reachy2 de Pollen Robotics (Bordeaux). Environ 2 200 épisodes de démonstrations téléopérées sont publiés en format LeRobot v3.0 sur HuggingFace, avec Diffusion Policy et π₀ (Physical Intelligence) comme baselines. Trois résultats principaux ressortent : la vision active améliore les performances, mais de façon conditionnelle à la tâche ; les politiques multi-tâches se dégradent nettement sous distribution shift contrôlé ; et l'imitation seule produit un regard anticipatoire dont les temps de préemption médians, mesurés par la métrique GALT (Gaze-Action Lead Time), sont comparables à ceux du téléopérateur humain de référence. Jusqu'ici, plusieurs groupes avaient démontré indépendamment les bénéfices de la vision active en 2024-2025, sans base commune de comparaison. TAVIS comble ce vide avec trois primitives reproductibles : un protocole comparatif caméra mobile/caméra fixe sur des démonstrations identiques, la métrique GALT issue des sciences cognitives et de l'HRI (Human-Robot Interaction), et des splits procéduraux in-distribution/out-of-distribution. Le constat que les gains sont task-conditional invalide l'hypothèse naïve qu'ajouter des degrés de liberté à la caméra améliore systématiquement les performances, nuance décisive pour les intégrateurs industriels. La fragilité sous distribution shift constitue un signal d'alarme concret pour tout déploiement hors simulation. La vision active en manipulation connaît un regain d'intérêt depuis 2024, porté par les progrès des VLA (Vision-Language-Action models) et la disponibilisation de robots humanoïdes à têtes articulées. Le choix de Reachy2 comme plateforme de référence est notable : Pollen Robotics, startup bordelaise fondée en 2016, est l'un des rares acteurs européens dont le robot open-source figure dans des benchmarks académiques internationaux, face aux concurrents américains (Figure, Agility) et asiatiques (Fourier, Unitree). Les prochaines étapes naturelles incluent l'évaluation de politiques VLA récentes comme GR00T N2 ou OpenVLA sur TAVIS, ainsi que le transfert sim-to-real, que le papier ne couvre pas encore.

UEPollen Robotics (Bordeaux) est l'une des deux seules plateformes de référence du benchmark TAVIS, ce qui ancre un acteur français open-source au cœur d'une infrastructure d'évaluation académique internationale pour les politiques VLA.

FR/EU ecosystemePaper

1 source

2Robotics & Automation News

Festo présente une pince robotique à base d'IA pour la manipulation de produits variés

Festo, l'équipementier allemand spécialisé en automatisation industrielle, a annoncé le lancement de GripperAI, un logiciel universel basé sur l'intelligence artificielle destiné à piloter des préhenseurs robotiques dans des environnements multi-produits. La solution cible un problème récurrent sur les lignes de production mixtes : lorsqu'une cellule robotisée doit saisir des produits de formes et de tailles variables, l'approche traditionnelle impose une reprogrammation manuelle, une intégration applicative spécifique et le recours à des systèmes de vision 3D coûteux. GripperAI se positionne comme une couche logicielle capable d'absorber cette variabilité sans redéveloppement à chaque référence. L'enjeu industriel est direct : le coût et la durée d'intégration sont aujourd'hui l'un des principaux freins au déploiement de cellules robotisées dans les environnements à forte diversité de SKU, logistique, agroalimentaire, manufacturier léger. Si GripperAI tient sa promesse de réduire la dépendance aux caméras 3D dédiées et à la programmation cas par cas, il pourrait abaisser significativement le seuil d'entrée pour les intégrateurs. Il convient de noter que Festo ne publie pas encore de métriques de cycle ou de taux de succès de préhension dans le communiqué disponible, ce qui rend toute évaluation de performance prématurée à ce stade. Festo est historiquement connu pour ses actionneurs pneumatiques et ses solutions bioinspirées (BionicCobot, Bionic Flying Fox), mais s'oriente depuis plusieurs années vers des briques logicielles pour robot-as-a-service. Sur ce segment des préhenseurs universels pilotés par IA, la concurrence est déjà positionnée : Robai, Righthand Robotics (racheté par BD), ainsi que des solutions vision-first comme Osaro ou CapSen Robotics. La prochaine étape pour Festo sera de démontrer GripperAI sur des configurations réelles en production, avec des données de performance publiées et des références clients vérifiables.

UEFesto étant un équipementier européen (allemand) très présent sur les lignes françaises et européennes, GripperAI pourrait réduire les coûts d'intégration pour les intégrateurs et industriels EU opérant en environnements multi-SKU, sous réserve de métriques de performance vérifiables.

FR/EU ecosystemeOpinion

1 source

3Robotics & Automation News

Pourquoi l'usinage suisse de précision est essentiel à l'avenir de la robotique et de l'automatisation

L'essor mondial de la robotique industrielle et des systèmes de fabrication intelligente génère une demande croissante pour des composants mécaniques usinés avec une précision extrême. Les robots collaboratifs, les systèmes d'assemblage automatisé et les équipements de production pilotés par capteurs reposent sur des pièces dont les tolérances s'expriment en microns. L'usinage de décolletage suisse (Swiss machining), technique CNC spécialisée dans la production de pièces cylindriques de petits diamètres à très haute précision, s'impose comme un maillon critique de cette chaîne d'approvisionnement, notamment pour les axes, arbres, vis-mères et composants de transmission intégrés dans les actionneurs et joints des bras robotiques. L'enjeu est structurel : un robot industriel ou collaboratif ne peut maintenir ses performances en production continue que si chaque composant respecte des tolérances serrées sur la durée. Une pièce légèrement hors cote dans un réducteur harmonique ou un rail de guidage peut induire des dérives cumulatives qui compromettent la répétabilité, paramètre central pour tout déploiement en ligne d'assemblage. Cela positionne les sous-traitants en décolletage suisse comme des fournisseurs de premier rang pour les intégrateurs robotiques, au même titre que les fournisseurs de motoréducteurs ou d'électronique embarquée. À noter : l'article reste de niveau "livre blanc promotionnel" et ne cite aucune métrique concrète ni aucun client. Le décolletage suisse est une industrie centenaire dominée par des acteurs européens, notamment en Suisse (canton de Neuchâtel) et dans le Jura français (Arc jurassien), ainsi qu'au Japon et en Allemagne. Face à la montée en charge des commandes robotiques, portée par Figure AI, Boston Dynamics, 1X Technologies ou encore le français Enchanted Tools, ces sous-traitants de précision se retrouvent en position stratégique, à condition d'investir dans l'automatisation de leur propre production pour tenir les volumes demandés par une industrie qui s'industrialise rapidement.

UELes sous-traitants en décolletage de l'Arc jurassien français sont directement positionnés comme fournisseurs stratégiques pour la vague de commandes robotiques mondiale, mais devront investir dans leur propre automatisation pour tenir les volumes.

FR/EU ecosystemeActu

1 source

4Interesting Engineering

L'Europe développe un bras robotique capable de voir, toucher et manipuler des échantillons pour les missions lunaires

L'Agence spatiale européenne (ESA) et l'entreprise aérospatiale italienne Leonardo finalisent l'intégration du Sample Transfer Arm (STA), un bras robotique de 2,4 mètres d'extension doté de sept degrés de liberté, actuellement assemblé dans les installations de Leonardo à Nerviano, près de Milan. Conçu à l'origine pour le programme Mars Sample Return conjoint NASA-ESA, le STA devait transférer les échantillons martiens collectés par le rover Perseverance en vue de leur retour sur Terre. L'avenir incertain de cette mission a conduit l'ESA à repositionner la technologie vers des applications lunaires et d'exploration plus larges. Le bras embarque des caméras, des capteurs de force et de couple en trois dimensions, des codeurs de position dans chaque articulation, et une unité électronique autonome faisant office de centre de contrôle. Sa pince en bout de bras offre une précision au millimètre. Les équipes entrent maintenant dans la phase de tests en environnement spatial simulé, prévue dans les prochaines semaines. Ce bras illustre concrètement la montée en maturité des systèmes robotiques à perception multimodale pour l'espace : la combinaison vision embarquée, retour haptique (capteur force-couple 6 axes) et contrôle de position en boucle fermée permet une manipulation semi-autonome sans intervention humaine en temps réel, ce qui est critique pour des missions où la latence de communication rend le télé-opérage direct impraticable. Pour les décideurs du secteur spatial institutionnel, le STA représente un démonstrateur crédible d'un bras polyvalent qui pourrait supporter aussi bien la collecte d'échantillons géologiques que l'assistance aux astronautes lors de séjours prolongés sur la Lune. La question du passage du laboratoire à un déploiement opérationnel reste ouverte : aucune mission concrète avec timeline précise n'est annoncée à ce stade, et les tests en cours à Nerviano devront valider les performances avant toute intégration sur un engin spatial réel. Le STA s'inscrit dans une dynamique européenne de consolidation des compétences robotiques spatiales face à une concurrence américaine (NASA, JPL) et émergente (Chine, CNSA). Le consortium industriel qui porte le projet reflète la géographie habituelle de l'industrie spatiale européenne : Leonardo en chef de file, GMV et AVS (Espagne) pour les logiciels et systèmes, Maxon (Suisse) pour les actionneurs de précision, 3DPlus (France) pour l'électronique résistante aux radiations, et COMOTI (Roumanie), avec des fournisseurs danois, grecs et allemands. La présence de 3DPlus, spécialiste français des composants électroniques durcis pour l'espace, mérite d'être notée dans ce contexte de souveraineté technologique. La prochaine étape critique sera la validation en conditions simulées de lancement et d'atterrissage, les mécanismes structurels du bras devant absorber les charges dynamiques sans dégrader la précision de positionnement acquise au sol.

UELa participation de 3DPlus (France) pour l'électronique durcie et le leadership ESA/Leonardo sur le STA renforcent la souveraineté technologique européenne en robotique spatiale à perception multimodale, segment stratégique face aux programmes NASA et CNSA.

FR/EU ecosystemeOpinion

1 source