RecherchearXiv cs.RO 12 juin 2026

Contrôle PI basé sur Lyapunov pour le suivi robuste de trajectoire d'un robot à quatre roues indépendantes : conception et validation expérimentale

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2602.15424v2) une loi de commande de type PI synthétisée par méthode de Lyapunov pour le suivi robuste de trajectoire d'un robot mobile à quatre roues indépendamment motorisées et directrices (4WID-4WIS, pour four-wheel independently driven and steered). Le modèle mathématique du robot est structurellement vérifié, ce qui permet une conception systématique avec des garanties formelles de stabilité, adaptées à l'implémentation temps réel. La loi de commande combine une structure PI classique avec une compensation anticipatrice fondée sur le modèle (feedforward model-based). Elle a été validée expérimentalement sur une plateforme 4WID-4WIS physique dans des conditions d'opération horizontales et verticales, et comparée à un régulateur PI standard ainsi qu'à un contrôleur en mode glissant (SMC, sliding-mode controller).

L'apport principal de ces travaux est la combinaison de garanties formelles de stabilité et d'une architecture légère, déployable sur des microcontrôleurs embarqués standard. L'analyse de stabilité pratique augmentée fournit des bornes explicites sur les dynamiques d'erreur de vitesse et d'erreur intégrale, ce qui permet à un intégrateur de dimensionner les marges opérationnelles sans simulation extensive. La loi de commande proposée surpasse le PI classique et l'approche par mode glissant en robustesse face aux dynamiques résiduelles dépendantes de la configuration et aux effets non modélisés. Pour un industriel ou un intégrateur de robots mobiles autonomes (AMR), cela signifie un contrôleur implémentable sur matériel embarqué standard, avec des garanties prouvables et sans la complexité d'ajustement propre au mode glissant.

Les robots 4WID-4WIS offrent une maniabilité omnidirectionnelle que les architectures différentielles ou Ackermann n'atteignent pas, mais leur dynamique couplée complique la synthèse de régulateurs performants et stables. Ces travaux s'inscrivent dans un courant visant à rendre rigoureusement prouvables des lois de commande déjà utilisées empiriquement en industrie. Côté positionnement concurrentiel, les contrôleurs en mode glissant garantissent une robustesse comparable mais souffrent du chattering et d'un réglage plus délicat; les approches MPC (Model Predictive Control) offrent une optimalité supérieure au prix d'une charge de calcul souvent incompatible avec les plateformes embarquées légères. Aucun partenaire industriel ni déploiement commercial n'est annoncé dans cette publication purement académique, dont la suite logique serait une validation sur des cycles opérationnels réels en environnement logistique ou de service.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Planification unifiée de trajectoires multi-contacts pour les robots à déplacement roulant

Des chercheurs ont publié sur arXiv (ref. 2606.29065) un cadre unifié de planification de trajectoire pour les robots à roulement multi-contacts sous contraintes de non-glissement. Le problème central est la planification de mouvement dans des systèmes où plusieurs corps sphériques roulent simultanément sans glisser, ce qui génère des contraintes non-holonomes couplées et une configuration évoluant sur une variété courbe. Le framework proposé repose sur la formulation de Montana en coordonnées de contact, où chaque point de contact est représenté par un vecteur d'état à cinq dimensions. Sur cette base géométrique, les auteurs construisent une carte routière de type Voronoï directement sur la variété de contact sphérique, intègrent des obstacles en calotte sphérique et des zones d'exclusion mutuelle via une vérification de collision sur la variété, puis raffinent les chemins discrets par un lissage log-exp cohérent avec la géométrie différentielle. Les trajectoires lissées sont ensuite remontées en mouvements de roulement admissibles via la cinématique Montana et validées par simulation forward. Cette publication s'attaque à une lacune réelle en planification de mouvement : les approches classiques peinent à gérer simultanément les contraintes non-holonomes, la topologie des variétés de contact et la présence de plusieurs points de contact couplés. L'intégration d'un Voronoï directement sur la variété sphérique, plutôt que dans un espace euclidien aplati, est la contribution technique principale, car elle préserve la géométrie intrinsèque sans distorsions. Il convient cependant de noter que la validation reste purement simulée : aucune expérience sur plateforme physique n'est rapportée, ce qui constitue une limite explicitement reconnue par les auteurs. Le domaine des robots à roulement sphérique reste une niche académique, distinct des humanoïdes ou des AMR (robots mobiles autonomes) à roues classiques, mais pertinent pour des plateformes comme les robots à roulement omnidirectionnel ou les systèmes de manipulation interne par sphère. La cinématique de Montana, référence fondatrice des années 1980-90 en mécanique de contact, est ici réemployée comme socle formel. Les auteurs annoncent trois extensions futures : géométries non-sphériques, environnements à obstacles dynamiques, et validation expérimentale sur plateforme réelle. En l'état, il s'agit d'une contribution théorique solide, pas encore d'un outil intégrable en production industrielle.

RecherchePaper

1 source

2arXiv cs.RO

Champs vectoriels pour le suivi de trajectoire sur les groupes de Lie, appliqués au contrôle robotique

Des chercheurs ont publié en février 2026 (arXiv 2602.21450) un cadre général de champs vectoriels pour le suivi de chemin sur les groupes de Lie, ciblant les systèmes robotiques capables de contrôler indépendamment leur position et leur orientation dans l'espace 3D. Les applications visées incluent les véhicules aériens omnidirectionnels, les robots sous-marins et les effecteurs de bras manipulateurs. Le problème est formalisé sur le groupe matriciel SE(3), qui encode l'ensemble des déplacements rigides dans l'espace à six degrés de liberté (trois en translation, trois en rotation). Le cadre proposé garantit la convergence vers une courbe paramétrique depuis presque toutes les conditions initiales, tout en assurant un mouvement continu le long du chemin. La commande en entrée est exprimée via le body twist, une représentation compacte de la vitesse locale combinant composantes linéaires et angulaires, ce qui s'aligne directement avec les interfaces de contrôle industrielles standard. Des expériences sur un manipulateur réel suivant des poses complexes valident l'approche, et une implémentation open-source accompagne la publication. La distinction entre trajectory tracking et path following est centrale : le tracking impose une contrainte temporelle stricte, alors que le path following ne contraint que la convergence spatiale vers le chemin. Pour un intégrateur ou un décideur industriel, cela se traduit par une robustesse accrue aux perturbations et une simplification de la programmation des tâches répétitives. L'usage du body twist comme représentation minimale réduit la charge computationnelle, avantage direct pour les boucles de contrôle temps-réel sur systèmes embarqués. La garantie de convergence topologique depuis "presque toutes" les conditions initiales distingue ce travail des approches locales classiques, qui exigent une initialisation proche de la trajectoire cible. Le contrôle de pose sur SE(3) est un champ actif depuis plusieurs décennies, avec des approches classiques souffrant de singularités liées aux représentations paramétriques comme les angles d'Euler ou les quaternions. Ce travail s'inscrit dans un mouvement plus large d'adoption de la géométrie différentielle en robotique, porté par plusieurs équipes académiques en Europe et en Amérique du Nord. Les méthodes d'apprentissage end-to-end comme les VLA (Vision-Language-Action) ne fournissent pas de garanties formelles équivalentes, ce qui maintient la pertinence de ces approches analytiques dans les contextes réglementés tels que le médical, le spatial ou le nucléaire. La disponibilité du code open-source abaisse la barrière d'adoption pour les équipes souhaitant intégrer ce framework sur leurs plateformes robotiques existantes.

UELes équipes R&D européennes en robotique peuvent adopter directement le framework open-source pour améliorer le contrôle de manipulateurs dans les secteurs réglementés (médical, spatial, nucléaire) où les garanties formelles de convergence sont exigées.

RecherchePaper

1 source

3arXiv cs.RO

LC-SAC : Soft Actor-Critic contraint par Lyapunov via la théorie de l'opérateur de Koopman pour le suivi et la stabilisation de trajectoires

Des chercheurs présentent LC-SAC (Lyapunov-Constrained Soft Actor-Critic), un algorithme d'apprentissage par renforcement publié en prépublication sur arXiv (2602.04132v4, quatrième révision). L'approche combine le Soft Actor-Critic standard avec des garanties formelles de stabilité issues de la théorie des opérateurs de Koopman. L'algorithme apprend une représentation linéarisée des dynamiques d'erreur via la Décomposition Dynamique en Modes Étendus (EDMD), puis résout l'Équation de Riccati Algébrique Discrète (DARE) pour obtenir une Fonction de Lyapunov de Contrôle (CLF) quadratique sous forme fermée. Cette CLF est intégrée comme pénalité lagrangienne dans la mise à jour de l'acteur, avec un objectif CVaR (Conditional Value-at-Risk) qui concentre la pression de contrainte sur les événements d'instabilité rares mais sévères. Trois améliorations EDMD rendent la CLF bien posée sur des modèles de haute dimension : normalisation du rayon spectral de la matrice A élevée, coût d'état LQR physiquement cohérent, et ancrage forçant V(0)=0. La méthode est validée en simulation sur cartpole et quadrirotor 3D. L'apport principal répond à un obstacle persistant : le RL appliqué aux systèmes physiques critiques peut induire des oscillations ou une divergence d'état non bornée faute de garanties de stabilité. En intégrant une CLF sans modélisation complète du système, LC-SAC vise des contrôleurs déployables sur robots réels sous contraintes de sécurité. L'étude d'ablation est particulièrement instructive : remplacer la contrainte lagrangienne dure par du façonnage de récompense (variante Lyap-RS-SAC) déstabilise l'apprentissage et effondre les performances sur les tâches quadrirotor, tranchant un débat récurrent sur la suffisance des pénalités implicites en RL contraint. Le domaine du RL sûr (safe RL) s'intensifie depuis 2022, porté par la demande de contrôleurs robotiques sortant des environnements simulés. Les approches concurrentes incluent les Barrières de Contrôle de Certification (CBF), les MDPs contraints (CMDP) et le contrôle LQR classique, chacun imposant soit des hypothèses de modèle fortes, soit un coût computationnel élevé. L'opérateur de Koopman, popularisé en robotique depuis environ 2020 pour la commande de systèmes non linéaires, permet ici une linéarisation systématique sans simplification physique excessive. La limite principale reste l'absence de validation matérielle : aucun déploiement sur plateforme physique n'est rapporté, laissant l'écart sim-to-real non mesuré. Les suites logiques seraient des expériences sur bras manipulateur ou drone réel.

RecherchePaper

1 source

4arXiv cs.RO

Influence des fonctions d'activation à base radiale sur un contrôleur intelligent pour manipulateurs robotiques

Une équipe de chercheurs a publié le 2 juillet 2026 sur arXiv (2607.02167) une étude sur le contrôle intelligent de bras robotiques manipulateurs, combinant commande non linéaire basée modèle et réseaux de neurones à fonction de base radiale (RBF) pour l'estimation en ligne des perturbations. Le système compense les incertitudes paramétriques, les frottements et les dynamiques non modélisées grâce à une loi d'adaptation fondée sur la théorie de Lyapunov avec projection, garantissant la bornitude des signaux en boucle fermée et la convergence de l'erreur de poursuite de trajectoire vers une région compacte. L'objectif central des auteurs était de mesurer l'impact du choix de la fonction d'activation au sein du réseau RBF sur le comportement transitoire, la précision en régime permanent et la douceur de la commande. Le contrôleur a été testé expérimentalement sur un manipulateur robotique réel, comparant plusieurs noyaux d'activation. Les résultats montrent que la stabilité est préservée quel que soit le noyau utilisé, mais que le choix de la fonction d'activation modifie significativement la dynamique d'adaptation et les performances pratiques de poursuite. Pour les concepteurs de systèmes de commande robotique, cette conclusion transforme un paramètre souvent traité comme un détail d'implémentation en véritable levier de conception structurel : sélectionner la bonne fonction d'activation peut améliorer la précision et la fluidité du mouvement sans changer l'architecture globale du contrôleur, un enjeu concret pour les intégrateurs travaillant sur des bras industriels ou collaboratifs soumis à des charges variables et des frottements imprévisibles. Cette recherche s'inscrit dans la lignée des travaux sur la commande adaptative neuronale des manipulateurs, un domaine où les réseaux RBF sont utilisés depuis plusieurs années pour approximer des dynamiques complexes difficiles à modéliser analytiquement. Contrairement aux approches d'apprentissage profond plus lourdes en calcul, la structure RBF combinée à une preuve de stabilité de Lyapunov offre des garanties mathématiques recherchées dans les applications industrielles critiques. L'étude ne précise pas de suites concrètes ni de partenariat industriel, s'inscrivant dans une démarche de recherche fondamentale plutôt que de déploiement commercial immédiat.

RecherchePaper

1 source