Aller au contenu principal
RecherchearXiv cs.RO39min

Influence des fonctions d'activation à base radiale sur un contrôleur intelligent pour manipulateurs robotiques

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié le 2 juillet 2026 sur arXiv (2607.02167) une étude sur le contrôle intelligent de bras robotiques manipulateurs, combinant commande non linéaire basée modèle et réseaux de neurones à fonction de base radiale (RBF) pour l'estimation en ligne des perturbations. Le système compense les incertitudes paramétriques, les frottements et les dynamiques non modélisées grâce à une loi d'adaptation fondée sur la théorie de Lyapunov avec projection, garantissant la bornitude des signaux en boucle fermée et la convergence de l'erreur de poursuite de trajectoire vers une région compacte. L'objectif central des auteurs était de mesurer l'impact du choix de la fonction d'activation au sein du réseau RBF sur le comportement transitoire, la précision en régime permanent et la douceur de la commande. Le contrôleur a été testé expérimentalement sur un manipulateur robotique réel, comparant plusieurs noyaux d'activation.

Les résultats montrent que la stabilité est préservée quel que soit le noyau utilisé, mais que le choix de la fonction d'activation modifie significativement la dynamique d'adaptation et les performances pratiques de poursuite. Pour les concepteurs de systèmes de commande robotique, cette conclusion transforme un paramètre souvent traité comme un détail d'implémentation en véritable levier de conception structurel : sélectionner la bonne fonction d'activation peut améliorer la précision et la fluidité du mouvement sans changer l'architecture globale du contrôleur, un enjeu concret pour les intégrateurs travaillant sur des bras industriels ou collaboratifs soumis à des charges variables et des frottements imprévisibles.

Cette recherche s'inscrit dans la lignée des travaux sur la commande adaptative neuronale des manipulateurs, un domaine où les réseaux RBF sont utilisés depuis plusieurs années pour approximer des dynamiques complexes difficiles à modéliser analytiquement. Contrairement aux approches d'apprentissage profond plus lourdes en calcul, la structure RBF combinée à une preuve de stabilité de Lyapunov offre des garanties mathématiques recherchées dans les applications industrielles critiques. L'étude ne précise pas de suites concrètes ni de partenariat industriel, s'inscrivant dans une démarche de recherche fondamentale plutôt que de déploiement commercial immédiat.

Dans nos dossiers

À lire aussi

Formulation géométrique du contrôle unifié force-impédance sur SE(3) pour les manipulateurs robotiques
1arXiv cs.RO 

Formulation géométrique du contrôle unifié force-impédance sur SE(3) pour les manipulateurs robotiques

Des chercheurs ont soumis sur arXiv (identifiant 2504.17080, troisième révision) un cadre de contrôle baptisé GUFIC (Geometric Unified Force-Impedance Control), qui fusionne deux méthodes existantes, le contrôle d'impédance unifié par la force (UFIC) et le contrôle d'impédance géométrique (GIC), en les étendant au manifold SE(3), le groupe spécial euclidien décrivant l'ensemble des mouvements rigides à 6 degrés de liberté (translation et rotation). L'objectif est de permettre à un bras manipulateur de suivre simultanément une trajectoire complète dans l'espace et d'exercer une force précise sur une surface de contact, tout en garantissant la passivité du système grâce à l'augmentation par réservoir d'énergie (energy tank augmentation). La validation a été conduite uniquement en simulation, via le simulateur MuJoCo, sur des scénarios combinant suivi de trajectoire SE(3) et application de force ; le code est disponible en open source sur GitHub. L'enjeu central est de formuler le contrôle de contact sur la géométrie exacte du mouvement rigide plutôt que dans l'espace cartésien linéarisé, ce qui élimine des approximations qui dégradent les performances lors de rotations importantes. La garantie de passivité est directement pertinente pour les intégrateurs industriels : elle assure que le robot ne peut pas injecter d'énergie de façon incontrôlée en contact avec un environnement incertain, limitant les risques de dommages matériels ou humains. Le papier résout également un problème d'implémentation non-causale du UFIC original en introduisant des champs de vitesse et de force, rendant le contrôleur réellement déployable en temps réel. Les propriétés d'invariance et d'équivariance SE(3) héritées par le GUFIC améliorent par ailleurs l'efficacité d'échantillonnage des algorithmes d'apprentissage embarqués dans la loi de contrôle, un avantage non négligeable à mesure que les pipelines VLA (vision-language-action) s'intègrent aux contrôleurs bas niveau. Le GUFIC s'appuie sur deux lignées de travaux : le UFIC (Schindlbeck et Haddadin, 2015), référence établie pour le contrôle force-impédance, et le GIC développé précédemment par les mêmes auteurs pour appliquer la géométrie différentielle à l'impédance pure. Cette contribution s'inscrit dans la compétition entre approches géométriques et formulations classiques en espace opérationnel (Khatib) ou contrôle d'admittance. La validation hardware sur un manipulateur physique reste absente de ce papier, ce qui constitue la frontière habituelle entre contribution théorique et impact industriel tangible ; la disponibilité du code en open source facilitera néanmoins la reproduction et le portage vers des plateformes réelles par d'autres équipes de recherche.

UELe code open source peut être exploité par les laboratoires et intégrateurs robotiques européens travaillant sur la manipulation en contact, mais l'article ne mentionne aucun acteur FR/EU spécifique et la validation hardware reste absente.

RecherchePaper
1 source
PATCH : suivi des innovations de patchs latents conditionné par les séquences d'actions pour la manipulation robotique
2arXiv cs.RO 

PATCH : suivi des innovations de patchs latents conditionné par les séquences d'actions pour la manipulation robotique

Des chercheurs présentent PATCH (Action-Chunk-Conditioned Latent Patch Innovation Monitor), un moniteur d'exécution temps réel publié sur arXiv (2606.16690) conçu pour rendre les politiques de manipulation robotique plus robustes lors du déploiement en environnements ouverts. Le système s'appuie sur le "chunk" d'actions courant, séquence de commandes prédites d'un coup par la politique apprise, pour définir un corridor d'exécution projeté dans l'espace latent. À l'intérieur de ce corridor, PATCH prédit l'évolution attendue des patches visuels latents et accumule les résidus persistants que le mouvement propre du robot n'explique pas. Ces résidus constituent un signal d'intervention localisé : le composant PATCH-Router peut suspendre l'exécution, sélectionner une source de récupération disponible, puis reprendre la politique originale une fois l'innovation locale dissipée. Des expériences sur données réelles de déploiement montrent des déclenchements plus stables et plus contextuellement pertinents que les moniteurs concurrents évalués. L'enjeu est précis : les politiques de manipulation à base d'apprentissage (politiques de diffusion, modèles VLA) produisent des résultats convaincants en laboratoire mais restent fragiles dès qu'un objet bouge inopinément, qu'une occlusion transitoire survient ou qu'une perturbation apparaît près de la trajectoire prévue. Les moniteurs existants s'appuient sur des anomalies d'observation globales, l'incertitude de la politique ou des différences frame-à-frame, des mécanismes qui peinent à distinguer un risque d'exécution réel d'une variation visuelle bénigne (reflet, passage d'une personne en fond). PATCH déplace l'analyse au niveau local et conditionné sur l'intention du robot, ce qui réduit les faux positifs et permet une reprise automatique plutôt qu'un arrêt définitif. Pour un intégrateur industriel, cela change la logique de supervision : au lieu d'une e-stop humaine systématique, on dispose d'un mécanisme de récupération autonome gradué. L'article s'inscrit dans une vague de travaux qui cherchent à combler le "deployment gap" des VLA et des politiques de diffusion, notamment après que des systèmes comme Pi-0 (Physical Intelligence) ou RDT ont démontré des performances impressionnantes en conditions contrôlées. PATCH ne cherche pas à remplacer la politique de base mais à la surveiller et à la relancer de façon ciblée, une approche modulaire compatible avec n'importe quelle politique pré-entraînée. Aucun partenaire industriel ni calendrier de commercialisation n'est mentionné ; il s'agit pour l'instant d'une contribution de recherche accompagnée d'une page projet publique, sans déploiement à l'échelle annoncé.

RechercheOpinion
1 source
Des futurs imaginés aux actions exécutables : mélange d'actions latentes pour la manipulation robotique
3arXiv cs.RO 

Des futurs imaginés aux actions exécutables : mélange d'actions latentes pour la manipulation robotique

Des chercheurs ont publié sur arXiv (référence 2605.12167, mai 2026) une méthode baptisée MoLA, pour Mixture of Latent Actions, destinée à améliorer la manipulation robotique en exploitant les modèles génératifs de vidéo comme mécanisme d'anticipation. L'idée centrale : un robot peut "imaginer" la trajectoire visuelle future d'une tâche avant de l'exécuter, mais transformer ces séquences générées en commandes moteur concrètes reste un problème ouvert. MoLA introduit une interface dite orientée contrôle qui, au lieu de passer directement les images prédites à la politique de contrôle, mobilise un ensemble de modèles inverses de dynamique (IDM) pré-entraînés pour en extraire des actions latentes. Ces IDM sont multimodaux : ils capturent des indices sémantiques, de profondeur et de flux optique, fournissant une représentation structurée et physiquement ancrée des transitions d'état. L'approche a été évaluée sur les benchmarks simulés LIBERO, CALVIN et LIBERO-Plus, ainsi que sur des tâches de manipulation en conditions réelles, avec des gains annoncés en taux de succès, en cohérence temporelle et en généralisation. Le problème que MoLA tente de résoudre est structurel dans le domaine des VLA (Vision-Language-Action models) : les modèles de génération vidéo optimisent la fidélité perceptuelle, pas la pertinence pour le contrôle. Lorsqu'une politique est conditionnée sur des frames prédites, elle hérite de cette inadéquation, produisant un contrôle indirect et instable. En substituant aux frames brutes des représentations latentes inférées par des IDM complémentaires, MoLA réduit ce fossé structurel. Pour les intégrateurs et les équipes de recherche appliquée, c'est un signal important : l'imagination visuelle peut effectivement améliorer les politiques robotiques, à condition de disposer d'une couche de traduction adaptée plutôt que d'un couplage direct image-action. Ce travail s'inscrit dans un courant actif autour des world models appliqués à la robotique, où des approches comme DreamerV3 (DeepMind) ou SuSIE ont exploré des pistes similaires pour le reinforcement learning et la manipulation. Côté manipulation guidée par vidéo, UniSim et les travaux autour de Pi-0 de Physical Intelligence ont popularisé l'utilisation de prédictions futures pour structurer le comportement. MoLA se distingue par son architecture modulaire à IDM mixtes plutôt qu'un seul encodeur unifié. Aucune affiliation industrielle ni timeline de déploiement n'est mentionnée dans la publication, ce qui en fait pour l'instant une contribution de recherche fondamentale, dont la valeur pratique dépendra de la reproductibilité des gains annoncés en dehors des benchmarks de référence.

RechercheOpinion
1 source
Mémoire analytique centrée sur les concepts pour la manipulation incarnée à base d'agents
4arXiv cs.RO 

Mémoire analytique centrée sur les concepts pour la manipulation incarnée à base d'agents

Une équipe de recherche a soumis le 30 juin 2026 sur arXiv (arXiv:2606.29774) un cadre de mémoire structurée pour agents de manipulation robotique à long horizon. Baptisé "analytic concept-centric memory", le système organise l'expérience autour de concepts analytiques : chaque objet est représenté par ses parties sémantiques, des gabarits paramétriques, des poses ancrées dans l'espace, ses affordances et ses états de manipulation. Deux couches supplémentaires complètent l'architecture : une mémoire de transitions enregistrant les effets des actions sur l'état de scène, et une mémoire de compétences (skill memory) stockant des politiques réutilisables ancrées dans ces gabarits. À l'exécution, l'agent effectue une récupération coarse-to-fine pour identifier objets pertinents, états courants et compétences applicables. Les auteurs valident leur approche sur des tâches de manipulation dépendantes de la mémoire, la généralisation à des objets articulés (portes, tiroirs) et une évaluation en environnement réel. La gestion de mémoire reste un goulet d'étranglement critique en manipulation longue durée. Les agents actuels, y compris ceux fondés sur des architectures VLA (Vision-Language-Action), peinent à réutiliser les connaissances acquises lors d'interactions passées, forçant une replanification coûteuse à chaque nouvelle tâche. Ce cadre montre que structurer explicitement la mémoire autour de concepts physiques améliore le taux de complétion de tâches, la précision de récupération, la réidentification d'objets et la généralisation de compétences inter-objets, par rapport aux baselines non structurées et aux représentations vectorielles par embeddings. Pour les intégrateurs industriels, c'est un signal que la réutilisabilité des compétences sans réentraînement complet commence à devenir atteignable, ce qui réduit potentiellement les coûts de déploiement dans des environnements variables. La manipulation robotique à long horizon est un chantier actif chez plusieurs acteurs majeurs : Google DeepMind avec ses architectures RT-2 et SayCan, Physical Intelligence et son modèle Pi-0, Boston Dynamics, ainsi que des laboratoires comme Stanford et ETH Zurich. Ce travail s'inscrit dans une lignée cherchant à concilier planification symbolique structurée et politiques neuronales, deux paradigmes longtemps opposés. Ce preprint n'a pas encore été soumis à revue par les pairs, et les benchmarks restent des environnements de laboratoire contrôlés. La démonstration sur une plateforme industrielle réelle, avec la diversité des objets, le bruit sensoriel et les contraintes temps réel, reste à établir. Les prochaines étapes naturelles incluent l'intégration avec des VLA à grande échelle et l'évaluation sur des manipulateurs ou humanoïdes en contexte de production semi-réelle.

RechercheOpinion
1 source