Aller au contenu principal
Contrôle PI basé sur Lyapunov pour le suivi robuste de trajectoire d'un robot à quatre roues indépendantes : conception et validation expérimentale
RecherchearXiv cs.RO1j

Contrôle PI basé sur Lyapunov pour le suivi robuste de trajectoire d'un robot à quatre roues indépendantes : conception et validation expérimentale

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2602.15424v2) une loi de commande de type PI synthétisée par méthode de Lyapunov pour le suivi robuste de trajectoire d'un robot mobile à quatre roues indépendamment motorisées et directrices (4WID-4WIS, pour four-wheel independently driven and steered). Le modèle mathématique du robot est structurellement vérifié, ce qui permet une conception systématique avec des garanties formelles de stabilité, adaptées à l'implémentation temps réel. La loi de commande combine une structure PI classique avec une compensation anticipatrice fondée sur le modèle (feedforward model-based). Elle a été validée expérimentalement sur une plateforme 4WID-4WIS physique dans des conditions d'opération horizontales et verticales, et comparée à un régulateur PI standard ainsi qu'à un contrôleur en mode glissant (SMC, sliding-mode controller).

L'apport principal de ces travaux est la combinaison de garanties formelles de stabilité et d'une architecture légère, déployable sur des microcontrôleurs embarqués standard. L'analyse de stabilité pratique augmentée fournit des bornes explicites sur les dynamiques d'erreur de vitesse et d'erreur intégrale, ce qui permet à un intégrateur de dimensionner les marges opérationnelles sans simulation extensive. La loi de commande proposée surpasse le PI classique et l'approche par mode glissant en robustesse face aux dynamiques résiduelles dépendantes de la configuration et aux effets non modélisés. Pour un industriel ou un intégrateur de robots mobiles autonomes (AMR), cela signifie un contrôleur implémentable sur matériel embarqué standard, avec des garanties prouvables et sans la complexité d'ajustement propre au mode glissant.

Les robots 4WID-4WIS offrent une maniabilité omnidirectionnelle que les architectures différentielles ou Ackermann n'atteignent pas, mais leur dynamique couplée complique la synthèse de régulateurs performants et stables. Ces travaux s'inscrivent dans un courant visant à rendre rigoureusement prouvables des lois de commande déjà utilisées empiriquement en industrie. Côté positionnement concurrentiel, les contrôleurs en mode glissant garantissent une robustesse comparable mais souffrent du chattering et d'un réglage plus délicat; les approches MPC (Model Predictive Control) offrent une optimalité supérieure au prix d'une charge de calcul souvent incompatible avec les plateformes embarquées légères. Aucun partenaire industriel ni déploiement commercial n'est annoncé dans cette publication purement académique, dont la suite logique serait une validation sur des cycles opérationnels réels en environnement logistique ou de service.

Dans nos dossiers

À lire aussi

Champs vectoriels pour le suivi de trajectoire sur les groupes de Lie, appliqués au contrôle robotique
1arXiv cs.RO 

Champs vectoriels pour le suivi de trajectoire sur les groupes de Lie, appliqués au contrôle robotique

Des chercheurs ont publié en février 2026 (arXiv 2602.21450) un cadre général de champs vectoriels pour le suivi de chemin sur les groupes de Lie, ciblant les systèmes robotiques capables de contrôler indépendamment leur position et leur orientation dans l'espace 3D. Les applications visées incluent les véhicules aériens omnidirectionnels, les robots sous-marins et les effecteurs de bras manipulateurs. Le problème est formalisé sur le groupe matriciel SE(3), qui encode l'ensemble des déplacements rigides dans l'espace à six degrés de liberté (trois en translation, trois en rotation). Le cadre proposé garantit la convergence vers une courbe paramétrique depuis presque toutes les conditions initiales, tout en assurant un mouvement continu le long du chemin. La commande en entrée est exprimée via le body twist, une représentation compacte de la vitesse locale combinant composantes linéaires et angulaires, ce qui s'aligne directement avec les interfaces de contrôle industrielles standard. Des expériences sur un manipulateur réel suivant des poses complexes valident l'approche, et une implémentation open-source accompagne la publication. La distinction entre trajectory tracking et path following est centrale : le tracking impose une contrainte temporelle stricte, alors que le path following ne contraint que la convergence spatiale vers le chemin. Pour un intégrateur ou un décideur industriel, cela se traduit par une robustesse accrue aux perturbations et une simplification de la programmation des tâches répétitives. L'usage du body twist comme représentation minimale réduit la charge computationnelle, avantage direct pour les boucles de contrôle temps-réel sur systèmes embarqués. La garantie de convergence topologique depuis "presque toutes" les conditions initiales distingue ce travail des approches locales classiques, qui exigent une initialisation proche de la trajectoire cible. Le contrôle de pose sur SE(3) est un champ actif depuis plusieurs décennies, avec des approches classiques souffrant de singularités liées aux représentations paramétriques comme les angles d'Euler ou les quaternions. Ce travail s'inscrit dans un mouvement plus large d'adoption de la géométrie différentielle en robotique, porté par plusieurs équipes académiques en Europe et en Amérique du Nord. Les méthodes d'apprentissage end-to-end comme les VLA (Vision-Language-Action) ne fournissent pas de garanties formelles équivalentes, ce qui maintient la pertinence de ces approches analytiques dans les contextes réglementés tels que le médical, le spatial ou le nucléaire. La disponibilité du code open-source abaisse la barrière d'adoption pour les équipes souhaitant intégrer ce framework sur leurs plateformes robotiques existantes.

UELes équipes R&D européennes en robotique peuvent adopter directement le framework open-source pour améliorer le contrôle de manipulateurs dans les secteurs réglementés (médical, spatial, nucléaire) où les garanties formelles de convergence sont exigées.

RecherchePaper
1 source
LC-SAC : Soft Actor-Critic contraint par Lyapunov via la théorie de l'opérateur de Koopman pour le suivi et la stabilisation de trajectoires
2arXiv cs.RO 

LC-SAC : Soft Actor-Critic contraint par Lyapunov via la théorie de l'opérateur de Koopman pour le suivi et la stabilisation de trajectoires

Des chercheurs présentent LC-SAC (Lyapunov-Constrained Soft Actor-Critic), un algorithme d'apprentissage par renforcement publié en prépublication sur arXiv (2602.04132v4, quatrième révision). L'approche combine le Soft Actor-Critic standard avec des garanties formelles de stabilité issues de la théorie des opérateurs de Koopman. L'algorithme apprend une représentation linéarisée des dynamiques d'erreur via la Décomposition Dynamique en Modes Étendus (EDMD), puis résout l'Équation de Riccati Algébrique Discrète (DARE) pour obtenir une Fonction de Lyapunov de Contrôle (CLF) quadratique sous forme fermée. Cette CLF est intégrée comme pénalité lagrangienne dans la mise à jour de l'acteur, avec un objectif CVaR (Conditional Value-at-Risk) qui concentre la pression de contrainte sur les événements d'instabilité rares mais sévères. Trois améliorations EDMD rendent la CLF bien posée sur des modèles de haute dimension : normalisation du rayon spectral de la matrice A élevée, coût d'état LQR physiquement cohérent, et ancrage forçant V(0)=0. La méthode est validée en simulation sur cartpole et quadrirotor 3D. L'apport principal répond à un obstacle persistant : le RL appliqué aux systèmes physiques critiques peut induire des oscillations ou une divergence d'état non bornée faute de garanties de stabilité. En intégrant une CLF sans modélisation complète du système, LC-SAC vise des contrôleurs déployables sur robots réels sous contraintes de sécurité. L'étude d'ablation est particulièrement instructive : remplacer la contrainte lagrangienne dure par du façonnage de récompense (variante Lyap-RS-SAC) déstabilise l'apprentissage et effondre les performances sur les tâches quadrirotor, tranchant un débat récurrent sur la suffisance des pénalités implicites en RL contraint. Le domaine du RL sûr (safe RL) s'intensifie depuis 2022, porté par la demande de contrôleurs robotiques sortant des environnements simulés. Les approches concurrentes incluent les Barrières de Contrôle de Certification (CBF), les MDPs contraints (CMDP) et le contrôle LQR classique, chacun imposant soit des hypothèses de modèle fortes, soit un coût computationnel élevé. L'opérateur de Koopman, popularisé en robotique depuis environ 2020 pour la commande de systèmes non linéaires, permet ici une linéarisation systématique sans simplification physique excessive. La limite principale reste l'absence de validation matérielle : aucun déploiement sur plateforme physique n'est rapporté, laissant l'écart sim-to-real non mesuré. Les suites logiques seraient des expériences sur bras manipulateur ou drone réel.

RecherchePaper
1 source
BiPneu : conception et contrôle d'un système pneumatique à pression bipolaire pour robots souples
3arXiv cs.RO 

BiPneu : conception et contrôle d'un système pneumatique à pression bipolaire pour robots souples

Des chercheurs ont publié sur arXiv (ref. 2605.12804) BiPneu, un système pneumatique multicanal capable de gérer simultanément des pressions positives et négatives pour actionner des robots souples. L'architecture repose sur un contrôleur à modes glissants dual (DM-SMC, Dual-Mode Sliding-Mode Controller) couplé à une sélection de mode supervisée par hystérésis, dérivé d'un modèle électro-pneumatique hybride. En tests expérimentaux, le DM-SMC atteint une erreur absolue moyenne de 1,44 kPa sur des références en échelon, et de 4,23 kPa en suivi sinusoïdal, soit des réductions respectives de 11,9 % et 35,6 % par rapport à un PID bien calibré. Le système surpasse également un contrôleur prédictif (MPC) avancé, tout en réduisant l'effort de commande, le taux de commutation des électrovannes et le temps de réponse transitoire. Deux démonstrations physiques valident l'approche : manipulation dynamique d'une balle avec un manipulateur parallèle souple, et téléopération en temps réel d'un actionneur à soufflets piloté par éléments finis (FEM). La régulation bipolaire -- pression positive pour gonfler, pression négative pour aspirer -- est le point dur de la robotique souple : les dynamiques d'inflation et de dégonflement sont asymétriques, les électrovannes introduisent des non-linéarités, et les transitions génèrent des perturbations de débit difficiles à compenser. BiPneu s'attaque directement à ces trois problèmes dans un seul framework scalable et économique, compatible avec les écosystèmes logiciels standards (ROS implicitement). Pour un intégrateur ou un laboratoire de R&D, cela signifie qu'il devient possible de déployer des actionneurs souples bipolaires sans développer un contrôleur bas niveau sur mesure, ce qui était jusqu'ici le principal frein à la standardisation de ces systèmes. La robotique souple pneumatique s'appuie depuis une décennie sur des régulateurs PID éprouvés, mais les limites de cette approche face aux dynamiques non linéaires des actionneurs à chambre variable ont poussé plusieurs équipes vers le MPC ou les contrôleurs adaptatifs. BiPneu positionne le DM-SMC comme une alternative plus robuste et moins coûteuse en calcul que le MPC, tout en restant plus précis que le PID. Il n'existe pas à ce stade de déploiement industriel annoncé ni de partenariat commercial mentionné -- il s'agit d'une contribution académique de type preprint, dont la robustesse reste à valider hors laboratoire sur des cycles prolongés et des géométries d'actionneurs variées.

RecherchePaper
1 source
Contrôle de hauteur et planification optimale du couple pour le saut de robots bipèdes à roues
4arXiv cs.RO 

Contrôle de hauteur et planification optimale du couple pour le saut de robots bipèdes à roues

Des chercheurs présentent dans un preprint arXiv (2605.03302, mai 2026) deux méthodes combinées pour contrôler avec précision la hauteur de saut des robots bipèdes à roues. Le constat de départ est pratique : face à l'incertitude dynamique, ces plateformes sautent systématiquement plus haut que nécessaire pour garantir la sécurité, ce qui génère des pertes moteur évitables, des forces de contact au sol excessives et une surconsommation énergétique. La première contribution, le modèle W-JBD (Wheeled-Bipedal Jumping Dynamical), permet de cibler précisément une hauteur de saut, mais produit une consigne de couple en échelon incompatible avec les actionneurs réels. La seconde, BOTP (Bayesian Optimization for Torque Planning), optimise la trajectoire de couple sans nécessiter de modèle dynamique précis et converge en 40 itérations en moyenne. Validée sur le simulateur Webots, BOTP réduit l'erreur de hauteur de 82,3 % et la consommation énergétique de 26,9 % par rapport à la baseline, tout en produisant une courbe de couple continue. Ce résultat est pertinent pour les intégrateurs qui déploient des robots bipèdes à roues dans des environnements industriels ou logistiques : l'efficacité énergétique conditionne directement l'autonomie embarquée, et la reproductibilité du saut détermine la fiabilité du franchissement d'obstacles. Le fait que BOTP fonctionne sans modèle dynamique précis est un avantage opérationnel concret, car calibrer un modèle complet sur chaque variante de plateforme est coûteux. L'approche bayésienne converge rapidement, ce qui la rend adaptée à une validation sur robot réel avec un nombre limité d'essais physiques, un point critique pour réduire l'usure mécanique. Cela dit, les auteurs n'ont pas encore franchi le sim-to-real : l'ensemble des résultats reste en simulation, et le gap entre Webots et un vrai terrain reste à quantifier. Les robots bipèdes à roues constituent une classe en expansion : Unitree B2-W, l'ETH Zurich avec Ascento, ou encore les plateformes Handle/mobility de Boston Dynamics combinent la vitesse des roues avec la capacité de franchissement des pattes. Le planning de couple par optimisation bayésienne s'inscrit dans une tendance plus large qui vise à remplacer les contrôleurs MPC classiques, trop dépendants de modèles précis, par des méthodes d'optimisation légères adaptables à la production. Les auteurs annoncent comme prochaine étape la validation expérimentale sur robot physique en s'appuyant sur les trajectoires simulées pour réduire l'espace de recherche, ce qui devrait permettre de confirmer, ou non, la tenue des gains annoncés hors simulation.

UELes travaux pourraient intéresser les équipes de recherche européennes sur les robots bipèdes à roues (notamment ETH Zurich / Ascento), mais l'impact reste indirect, sans contribution ni déploiement européen identifié.

RecherchePaper
1 source