Aller au contenu principal
Modélisation de robots continus par Flow Matching conditionné sur l'action
RecherchearXiv cs.RO6sem

Modélisation de robots continus par Flow Matching conditionné sur l'action

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de recherche a publié en mai 2026 (arXiv:2605.09216) une approche d'apprentissage automatique pour prédire la forme en régime stationnaire des robots continus à tendons (TDCRs, tendon-driven continuum robots). Le système combine une plateforme matérielle imprimée en 3D, un pipeline de collecte de données RGB-D multi-caméras, et un modèle de flow matching conditionné par l'état moteur, qui associe directement les commandes d'actionneurs à la géométrie 3D résultante sous forme de nuage de points. Les expériences couvrent des TDCRs simulés à 2, 3 et 5 modules sous MuJoCo, ainsi que des robots réels à 2 et 3 modules. Sur les métriques Chamfer Distance (CD) et Earth Mover's Distance (EMD), la méthode surpasse les approches antérieures de modélisation de déformables 3D et d'auto-modélisation robotique. Une extension en simulation montre que le même schéma conditionnel peut intégrer la charge utile en bout de bras comme variable d'entrée supplémentaire.

Ce résultat est notable pour les intégrateurs de robots chirurgicaux, d'inspection en espace confiné ou de manipulation flexible, trois domaines où les TDCRs sont candidats naturels mais restent difficiles à contrôler précisément. Les méthodes analytiques classiques, basées sur la théorie des tiges de Cosserat, requièrent une caractérisation fine des paramètres de friction et de rigidité, souvent non reproductibles d'un exemplaire à l'autre en raison de la variabilité fabrication. L'approche présentée délègue cette complexité à la donnée : un échantillonnage de configurations quasi-statiques suffit à entraîner le modèle, sans connaissance du modèle physique. Le conditionnement par payload ouvre la voie à une planification adaptative en charge variable, ce que les modèles analytiques actuels gèrent mal en temps réel.

Le flow matching, popularisé depuis 2022 comme alternative aux modèles de diffusion pour sa rapidité d'inférence, est ici appliqué pour la première fois à l'auto-modélisation cinématique de robots continus, selon les auteurs. Les approches concurrentes reposent soit sur des modèles physiques paramétriques, soit sur des réseaux neuronaux entraînés sur des représentations volumétriques ou de pose d'extrémité, sans géométrie complète. La plateforme 3D imprimée vise à rendre la méthode reproductible à faible coût. L'article reste un preprint sans déploiement annoncé ; les prochaines étapes naturelles incluent l'extension au contrôle en boucle fermée et la validation sur des robots à plus de 5 modules.

Dans nos dossiers

À lire aussi

Opérateurs neuronaux pour la modélisation par substitution de l'espace de conception des robots continus à actionnement par tendons
1arXiv cs.RO 

Opérateurs neuronaux pour la modélisation par substitution de l'espace de conception des robots continus à actionnement par tendons

Des chercheurs ont soumis sur arXiv (identifiant 2605.19104, mai 2026) un cadre de modélisation par apprentissage d'opérateurs pour les robots continus actionnés par tendons. Le problème adressé est fondamental : les modèles physiques classiques issus de la mécanique des poutres de Cosserat sont trop coûteux en calcul pour le contrôle temps réel, tandis que les approches d'apprentissage automatique existantes se spécialisent sur un design de robot précis et ne transfèrent pas. La contribution propose de reformuler le problème comme un apprentissage d'opérateurs, une famille de méthodes qui apprend des mappings entre espaces fonctionnels plutôt qu'entre vecteurs fixes. Un modèle unique ingère conjointement les paramètres de conception du robot (géométrie des segments, propriétés mécaniques) et les entrées d'actionnement par tendons, et prédit la configuration résultante. Quatre architectures sont présentées : deux variantes de Deep Operator Networks (DeepONets) et deux variantes de Fourier Neural Operators (FNOs), toutes entraînées sur des données de simulation. L'enjeu industriel est la généralisation inter-designs en espace de conception. Pour un OEM ou un intégrateur en robotique chirurgicale, évaluer des milliers de variantes mécaniques sans relancer de simulations physiques complètes représente un gain de cycle de design considérable. Les auteurs décrivent une "bonne précision" et des temps d'inférence compatibles avec le contrôle embarqué, sans donner d'erreurs quantitatives dans l'abstract. Point de vigilance éditorial : l'entraînement est réalisé exclusivement sur données simulées, et aucune validation hardware n'est rapportée. Les robots continus à tendons sont particulièrement exposés au sim-to-real gap, notamment les frottements de câbles, l'hystérésis, et les déformations non modélisées sous charge. Les robots continus occupent une niche stratégique en endoscopie robotisée et inspection en espace confiné, avec des acteurs commerciaux comme Intuitive Surgical (Da Vinci), Auris Health (Monarch, racheté par J\&J) et Medtronic. Côté recherche académique, les groupes travaillant sur la modélisation apprise pour robots déformables incluent Imperial College London, ETH Zürich et plusieurs labos nord-américains. Ce preprint reste une contribution théorique et computationnelle : aucun déploiement, aucun partenariat industriel ni timeline de validation physique ne sont mentionnés. La prochaine étape naturelle, et le vrai test de la méthode, sera la validation sur banc d'essai avec des prototypes réels aux designs variés.

UEImpact indirect et lointain : des groupes européens comme Imperial College London et ETH Zürich travaillent sur des problématiques voisines, mais ce preprint sans validation hardware ni partenariat industriel n'a pas d'effet immédiat sur la France ou l'industrie robotique de l'UE.

RecherchePaper
1 source
Modélisation dynamique par données d'un robot continu à actionnement tendineux
2arXiv cs.RO 

Modélisation dynamique par données d'un robot continu à actionnement tendineux

Des chercheurs associés au CERN publient sur arXiv (arXiv:2605.18720, mai 2025) une étude comparative de méthodes d'identification de systèmes par apprentissage automatique appliquées à un robot continu à actionnement par tendons équipé de joints roulants. Trois approches ont été évaluées : N4SID (identification par sous-espaces), ARX (modèle autorégressif à entrées exogènes) et SINDYc (identification parcimonieuse de dynamiques non linéaires avec contrôle). Le résultat central : malgré le nombre élevé de joints du robot, un modèle dynamique à seulement deux degrés de liberté (2-DDL) suffit à capturer fidèlement le comportement du système, grâce aux fortes dépendances cinématiques entre les joints. Les modèles obtenus ont été validés sur données expérimentales, puis intégrés dans un contrôleur prédictif (MPC) opérant en temps réel. L'enjeu est réel pour quiconque travaille sur le contrôle de robots continus : leur dynamique est réputée difficile à modéliser, dominée par la friction, hautement non linéaire et de dimension élevée. Démontrer qu'un modèle 2-DDL issu de données expérimentales suffit pour piloter un MPC réduit considérablement la complexité d'intégration. Cela ouvre la voie à des boucles de contrôle plus rapides sans requérir de modèles analytiques complets, souvent inaccessibles pour les structures souples. Le robot en question est développé au CERN, probablement pour des applications d'inspection ou de maintenance dans des environnements confinés, domaine où les robots continus rivalisent avec des solutions de Festo Robotics ou des laboratoires comme le BioRobotics Institute de Pise. L'article reste un preprint non encore évalué par les pairs, et les performances du MPC en conditions opérationnelles réelles restent à confirmer.

UELe CERN étant une institution paneuropéenne (Genève, FR/CH), les méthodes présentées, modèle 2-DDL data-driven couplé à un MPC temps réel, intéressent directement les équipes R&D européennes travaillant sur l'inspection robotisée en environnements confinés (nucléaire, ITER, maintenance industrielle).

RecherchePaper
1 source
SoFFT : transformée de Fourier spatiale pour la modélisation des robots souples continus
3arXiv cs.RO 

SoFFT : transformée de Fourier spatiale pour la modélisation des robots souples continus

Une équipe de chercheurs a proposé SoFFT (Spatial Fourier Transform for Soft Robots), une méthode de modélisation des robots souples continus basée sur l'application de la transformée de Fourier à la courbe centrale du robot, appelée "backbone", décrite comme un signal spatial et temporel. Publiée sur arXiv en février 2025 (identifiant 2502.17347), l'approche s'ancre dans la théorie des tiges de Cosserat, le cadre formel dominant pour modéliser ce type de structure, et a été validée à la fois par simulation numérique et sur un prototype physique réel. Les auteurs rapportent une réduction du nombre de degrés de liberté (DOF) effectifs nécessaires à la représentation fidèle de la déformation, sans toutefois quantifier précisément cette réduction dans le résumé disponible, ce qui rend difficile toute comparaison directe avec les méthodes existantes. L'enjeu central est que les robots souples continus, constitués de matériaux flexibles comme des élastomères ou des tubes en silicone, possèdent théoriquement une infinité de degrés de liberté, rendant leur modélisation et leur contrôle en temps réel computationnellement très coûteux. En traitant le backbone comme un signal, SoFFT ne conserve que ses composantes fréquentielles dominantes, compactant la description sans sacrifier la précision. Autre point notable : la méthode unifie et justifie formellement plusieurs heuristiques de modélisation déjà répandues dans la littérature, leur offrant un fondement théorique solide. Pour les équipes travaillant sur des cathéters robotiques, des bras endoscopiques ou des manipulateurs à actionnement pneumatique, cette réduction de modèle ouvre des perspectives pour des contrôleurs embarqués plus légers, potentiellement compatibles avec des architectures temps réel contraintes. La théorie des tiges de Cosserat s'est imposée dans la robotique souple depuis les années 2010, mais la complexité computationnelle des modèles haute-fidélité reste un frein au déploiement industriel. Plusieurs groupes concurrents, notamment à l'ETH Zurich, au MIT et à l'Université de Bristol, explorent des alternatives comme les réseaux de neurones physiques (physics-informed neural networks) ou les modèles réduits par analyse modale. SoFFT se positionne à l'intersection du formalisme analytique et de l'apprentissage piloté par les données, grâce à sa composante expérimentale permettant d'ajuster le modèle à partir de mesures réelles. Les suites logiques seraient l'intégration dans une boucle de contrôle fermée et la validation sur des architectures multi-segments, configurations courantes dans les applications médicales et d'inspection industrielle.

RecherchePaper
1 source
PATCH : suivi des innovations de patchs latents conditionné par les séquences d'actions pour la manipulation robotique
4arXiv cs.RO 

PATCH : suivi des innovations de patchs latents conditionné par les séquences d'actions pour la manipulation robotique

Des chercheurs présentent PATCH (Action-Chunk-Conditioned Latent Patch Innovation Monitor), un moniteur d'exécution temps réel publié sur arXiv (2606.16690) conçu pour rendre les politiques de manipulation robotique plus robustes lors du déploiement en environnements ouverts. Le système s'appuie sur le "chunk" d'actions courant, séquence de commandes prédites d'un coup par la politique apprise, pour définir un corridor d'exécution projeté dans l'espace latent. À l'intérieur de ce corridor, PATCH prédit l'évolution attendue des patches visuels latents et accumule les résidus persistants que le mouvement propre du robot n'explique pas. Ces résidus constituent un signal d'intervention localisé : le composant PATCH-Router peut suspendre l'exécution, sélectionner une source de récupération disponible, puis reprendre la politique originale une fois l'innovation locale dissipée. Des expériences sur données réelles de déploiement montrent des déclenchements plus stables et plus contextuellement pertinents que les moniteurs concurrents évalués. L'enjeu est précis : les politiques de manipulation à base d'apprentissage (politiques de diffusion, modèles VLA) produisent des résultats convaincants en laboratoire mais restent fragiles dès qu'un objet bouge inopinément, qu'une occlusion transitoire survient ou qu'une perturbation apparaît près de la trajectoire prévue. Les moniteurs existants s'appuient sur des anomalies d'observation globales, l'incertitude de la politique ou des différences frame-à-frame, des mécanismes qui peinent à distinguer un risque d'exécution réel d'une variation visuelle bénigne (reflet, passage d'une personne en fond). PATCH déplace l'analyse au niveau local et conditionné sur l'intention du robot, ce qui réduit les faux positifs et permet une reprise automatique plutôt qu'un arrêt définitif. Pour un intégrateur industriel, cela change la logique de supervision : au lieu d'une e-stop humaine systématique, on dispose d'un mécanisme de récupération autonome gradué. L'article s'inscrit dans une vague de travaux qui cherchent à combler le "deployment gap" des VLA et des politiques de diffusion, notamment après que des systèmes comme Pi-0 (Physical Intelligence) ou RDT ont démontré des performances impressionnantes en conditions contrôlées. PATCH ne cherche pas à remplacer la politique de base mais à la surveiller et à la relancer de façon ciblée, une approche modulaire compatible avec n'importe quelle politique pré-entraînée. Aucun partenaire industriel ni calendrier de commercialisation n'est mentionné ; il s'agit pour l'instant d'une contribution de recherche accompagnée d'une page projet publique, sans déploiement à l'échelle annoncé.

RechercheOpinion
1 source