Aller au contenu principal
Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples
RecherchearXiv cs.RO6sem

Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié le 22 mai 2026 sur arXiv (référence 2605.17477) un article présentant une nouvelle approche de contrôle pour les manipulateurs robotiques à liaisons flexibles multiples, une classe de bras articulés légers aux avantages structurels réels mais difficiles à stabiliser. Le framework proposé combine une commande par backstepping en sortie (output-feedback) avec un opérateur neuronal DeepONet pour supprimer rapidement les vibrations et maintenir le suivi de trajectoire de l'effecteur terminal. Chaque segment du bras est modélisé comme une poutre de Timoshenko couplée à une équation différentielle ordinaire, transformée en un système PDE hyperbolique canonique avec dynamique aux frontières. Un contrôleur de frontière basé sur le backstepping injecte de l'amortissement distribué le long de la poutre, en n'utilisant que des mesures disponibles aux extrémités. Les expériences ont été conduites sur un manipulateur à deux liaisons flexibles, démontrant une suppression des vibrations et une convergence de l'effecteur significativement plus rapides qu'un régulateur quadratique linéaire (LQR) avec compensation feedforward.

L'enjeu industriel derrière ce type de recherche est concret : les manipulateurs flexibles permettent de réduire la masse embarquée et d'augmenter l'espace de travail, deux paramètres critiques pour la robotique collaborative, les bras montés sur mobile, ou les applications spatiales. Leur principal défaut, les oscillations résiduelles en fin de mouvement, pénalise directement les temps de cycle et la précision de placement. L'introduction de DeepONet pour approximer les noyaux de backstepping est la contribution pratique clé : elle réduit drastiquement le coût de calcul en ligne, rendant ce type de commande avancée compatible avec des contrôleurs embarqués à ressources limitées et capable de s'adapter en temps réel aux changements de configuration.

Le backstepping pour systèmes distribués (PDEs) est un domaine de contrôle théorique actif depuis une quinzaine d'années, porté notamment par les travaux de Miroslav Krstic (UC San Diego). L'usage des opérateurs neuronaux de type DeepONet pour accélérer ce type de calculs constitue une tendance émergente à l'intersection du machine learning et du contrôle optimal. Sur le plan concurrentiel, les grandes maisons de robotique industrielle (FANUC, KUKA, ABB) gèrent la flexibilité structurelle par du surdimensionnement mécanique ou des vitesses d'opération conservatrices ; des startups comme Machina Labs ou des acteurs de la manipulation légère pourraient bénéficier directement de ce type d'avancée. La prochaine étape logique serait une validation sur un bras à n > 2 liaisons en conditions industrielles réelles, condition nécessaire avant toute intégration produit.

Dans nos dossiers

À lire aussi

Commande modulaire par algèbre de Lie et EDP de manipulateurs flexibles multicorps
1arXiv cs.RO 

Commande modulaire par algèbre de Lie et EDP de manipulateurs flexibles multicorps

Une équipe de chercheurs a publié sur arXiv (preprint arXiv:2505.06709, mai 2026) un cadre de contrôle modulaire pour bras manipulateurs sériels à corps flexibles, applicable à un nombre arbitraire de segments opérant dans l'espace tridimensionnel. L'approche repose sur la théorie des visseurs (screw theory) et l'algèbre de Lie se(3), dans laquelle mouvements, déformations et efforts sont tous exprimés comme des torseurs (twists) et des bivisseurs de force (wrenches) dans un repère lié au corps. En substituant une équation aux dérivées partielles (PDE) de déformation basée sur les déformations en contrainte directement dans la dynamique, les chercheurs éliminent les accélérations élastiques distribuées et obtiennent un modèle gouverné uniquement par l'accélération de torseur et le champ de déformation. Une cinématique inverse compensant la déflexion de l'extrémité du bras génère en temps réel les trajectoires de chaque sous-système, et un contrôleur adaptatif par lien assure la convergence exponentielle des erreurs de suivi via des fonctions de Lyapunov composites, tout en estimant les paramètres physiques en ligne. L'intérêt de cette approche tient à sa modularité et à sa scalabilité : la preuve de stabilité globale est construite par sommation des fonctions de Lyapunov de chaque lien, et les termes d'interaction inter-segments s'annulent exactement grâce à la troisième loi de Newton et à l'invariance de cadre du produit puissance sur se(3) x se*(3). Pour les intégrateurs et les concepteurs de robots industriels ou collaboratifs, cela signifie qu'ajouter un segment à la chaîne ne remet pas en cause la preuve de stabilité existante : le certificat reste valide sans recalcul global. La prise en compte des flexibilités structurelles est un défi critique pour les bras légers à haute vitesse, où l'hypothèse de rigidité conduit à des erreurs de positionnement importantes. Le contrôle de manipulateurs flexibles est un domaine actif depuis les années 1990, dominé jusqu'ici par des méthodes modales (modes assumés, modes propres), qui souffrent d'une scalabilité limitée au-delà de quelques segments. Des approches concurrentes récentes exploitent les port-Hamiltoniens ou les méthodes de Galerkin en éléments finis, mais restent souvent restreintes aux bras plans ou à faible nombre de corps. Ce travail se positionne comme une alternative théoriquement plus générale, bien que les résultats présentés soient uniquement numériques (simulation), sans validation expérimentale sur un robot physique. La prochaine étape naturelle serait une campagne d'essais sur plateforme réelle, notamment sur des bras collaboratifs légers comme ceux d'Universal Robots ou Franka Emika, qui présentent justement des flexibilités non négligeables à charge nominale.

UEImpact indirect : Franka Emika (Allemagne) est explicitement citée comme plateforme cible naturelle pour la validation expérimentale, ce qui pourrait bénéficier à l'écosystème robotique collaboratif européen si ces travaux aboutissent à des implémentations réelles.

RecherchePaper
1 source
Régions circulaires sûres à expansion rapide pour une planification locale de trajectoires efficace
2arXiv cs.RO 

Régions circulaires sûres à expansion rapide pour une planification locale de trajectoires efficace

Des chercheurs ont publié sur arXiv (2605.16009, mai 2026) une méthode géométrique de navigation locale pour robots mobiles, baptisée FESCR (Fast Expanding Safe Circular Regions). Le principe repose sur le calcul d'une séquence de régions circulaires dérivées d'un scan LiDAR local : ces cercles s'étendent progressivement dans la direction du but tout en restant confinés à l'espace libre détecté. L'algorithme génère ainsi un couloir navigable en temps quasi-réel, sans recourir à un solveur d'optimisation. La méthode a été intégrée dans le framework ROS2 et évaluée dans un environnement simulé. Aucun déploiement sur hardware réel ni chiffres de benchmark précis (temps de calcul en ms, fréquence de replanning) ne sont fournis dans la prépublication. L'intérêt principal de cette approche est sa complexité algorithmique réduite par rapport aux méthodes concurrentes. Le Dynamic Window Approach (DWA) et le Model Predictive Control (MPC) reposent sur des boucles d'optimisation coûteuses, difficiles à tenir en temps réel dans des environnements denses ou changeants. Les Control Barrier Functions (CBF) et les techniques d'apprentissage apportent de la robustesse théorique mais introduisent soit une charge computationnelle élevée soit une dépendance aux données d'entraînement. FESCR contourne ces contraintes par une construction géométrique directe, ce qui, selon les auteurs, permet des horizons de planification plus longs à charge CPU égale. C'est un argument pertinent pour les intégrateurs AMR opérant sur des plateformes embarquées à ressources limitées, même si l'affirmation reste à valider sur des benchmarks standardisés (ex. nav2_benchmark, BARN dataset). La navigation locale est un problème ouvert depuis les travaux fondateurs de Fox et al. sur le DWA (1997). Les approches récentes comme TEB (Timed Elastic Band) ou MPPI (Model Predictive Path Integral) ont progressivement repoussé les limites de performance, mais au prix d'une complexité d'intégration croissante. FESCR s'inscrit dans un mouvement de retour aux méthodes géométriques légères, observable aussi dans des travaux comme les corridor-based planners de Carnegie Mellon ou les méthodes à champ de potentiel revisitées. Les prochaines étapes naturelles sont la validation sur robot réel (terrain irrégulier, obstacles dynamiques) et la comparaison quantitative avec nav2 DWB sur le benchmark BARN, ce que la prépublication ne fournit pas encore.

RecherchePaper
1 source
Apprentissage de politiques de trajectoire multi-modales pour la manipulation robotique efficace en données
3arXiv cs.RO 

Apprentissage de politiques de trajectoire multi-modales pour la manipulation robotique efficace en données

Des chercheurs ont publié le 1er juin 2026 sur arXiv (2606.01047) MATE (Multi-Modal Trajectory Policies), un cadre de prédiction de trajectoires pour la manipulation robotique construit sur une architecture Mixture-of-Experts (MoE). MATE traite simultanément des entrées hétérogènes, observations visuelles, instructions en langage naturel et représentations de trajectoires, en introduisant un routeur cosinus cross-modal qui garantit une affectation stable entre experts spécialisés, indépendamment de l'échelle des représentations. Un mécanisme de routage à température contrôlée avec injection de bruit stochastique prévient l'effondrement prématuré des experts (expert collapse). Sur le benchmark LIBERO, MATE améliore le taux de succès moyen de 4,75% par rapport aux politiques guidées par trajectoires existantes, particulièrement dans des scénarios à faible volume de données d'entraînement. Des tests en conditions réelles sur un robot jouant au ping-pong complètent la validation expérimentale. Le problème ciblé est la "modality interference" : quand une politique transformer unique traite dans le même espace de paramètres des signaux aussi disparates que des images RGB, du texte et des coordonnées de trajectoire, les représentations se perturbent mutuellement et les performances chutent. C'est un goulot d'étranglement bien documenté dans le développement des VLAs (Vision-Language-Action models) : les données de démonstration de qualité coûtent cher à collecter en environnement industriel. En proposant un découplage fin au niveau sub-token par spécialisation d'experts, MATE réduit cette interférence sans nécessiter de données supplémentaires. Pour les équipes robotique opérant avec des budgets de téléopération limités, c'est un signal positif, bien que les gains absolus (+4,75%) restent modestes et mesurés sur un benchmark académique contrôlé. La manipulation robotique généraliste est sous forte compétition depuis l'émergence des architectures transformer dédiées à la robotique vers 2022-2023. Des travaux comme ACT, Diffusion Policy, puis les VLAs OpenVLA (Berkeley/Stanford), pi0 de Physical Intelligence et GR00T N2 de NVIDIA ont progressivement unifié vision, langage et action. L'approche MoE reste moins explorée en robotique qu'en LLMs (GPT-4, Mixtral, DeepSeek-MoE), et MATE tente d'en résoudre les instabilités de routage propres aux modalités hétérogènes. Le benchmark LIBERO, développé par des institutions académiques américaines, est devenu une référence standard pour évaluer la généralisation en manipulation. À ce stade, il n'y a pas de déploiement industriel ni de partenariat annoncé : MATE est une preuve de concept académique, avec validation réelle limitée à un robot de ping-pong.

RechercheOpinion
1 source
Muninn : un modèle de diffusion de trajectoires, désormais plus rapide
4arXiv cs.RO 

Muninn : un modèle de diffusion de trajectoires, désormais plus rapide

Une équipe de chercheurs a publié Muninn (arXiv:2605.09999), un module d'accélération sans réentraînement pour les planificateurs de trajectoires basés sur la diffusion. Le système atteint jusqu'à 4,6x de gain en vitesse d'exécution sur plusieurs architectures de diffusion en espace d'état, sans dégradation mesurée des performances ni des métriques de sécurité. Muninn fonctionne comme un wrapper de cache : à chaque étape du débruitage itératif, il choisit en temps réel de recalculer la sortie du denoiser ou de réutiliser le résultat mis en cache. Cette décision repose sur deux signaux analytiques calibrés hors-ligne, une sonde légère de l'évolution de la représentation interne de la trajectoire et des coefficients de propagation d'erreur du denoiser, qui produisent ensemble un budget d'incertitude par étape. Ce budget borne formellement l'écart maximal entre la trajectoire mise en cache et celle qui aurait été calculée à pleine puissance de calcul. Les gains ont été validés sur matériel réel, en navigation en boucle fermée et en manipulation. La lenteur des modèles de diffusion en planification de trajectoires est un verrou bien identifié pour la robotique temps-réel. Les accélérations existantes imposaient jusqu'ici un compromis inévitable : modifier le sampler dégradait la qualité de trajectoire, tandis que la compression du réseau nécessitait un réentraînement coûteux. Muninn contourne ce dilemme en opérant strictement sans modifier les poids du modèle, ce qui le rend applicable immédiatement à n'importe quel planificateur diffusion déjà entraîné. Pour un intégrateur ou une équipe robotique industrielle, cela rend concrètement viables des architectures comme Diffusion Policy dans des boucles de contrôle haute fréquence. La certification analytique des bornes de déviation constitue un argument de poids pour les déploiements où la sécurité est une contrainte réglementaire. Les politiques par diffusion appliquées à la robotique ont émergé vers 2022-2023, portées notamment par Diffusion Policy (Chi et al., Columbia University), et se sont depuis déployées dans des architectures VLA et des planificateurs en espace d'état. Les méthodes d'accélération antérieures, DDIM et distillation par connaissance en tête, ne proposaient pas de cache adaptatif avec bornes certifiées, ce qui positionne Muninn comme une surcouche orthogonale et rétrocompatible avec l'existant. En tant que preprint arXiv, les résultats n'ont pas encore été soumis à revue par les pairs. Les prochaines étapes logiques concernent les stacks robotiques humanoïdes et industriels (Figure, Unitree, Boston Dynamics) qui expérimentent des politiques diffusion et cherchent à réduire la latence de planification en production. Le code est publié publiquement sur GitHub (gokulp01/Muninn).

RecherchePaper
1 source