Aller au contenu principal
RecherchearXiv cs.RO2h

Robuste contrôle dans l'espace opérationnel avec bornes de perturbation conformes pour une manipulation redondante sûre

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs proposent un nouveau cadre de contrôle pour bras robotiques redondants combinant modèle physique et apprentissage statistique, testé sur un manipulateur Franka Research 3 à 7 degrés de liberté. Le système associe un contrôleur par couple calculé en espace opérationnel (OSCTC) à un observateur d'état étendu (ESO) qui estime en temps réel les perturbations agissant sur la tâche, sans nécessiter de mesure complète de l'état du robot comme le font les approches par apprentissage résiduel. Pour garantir la sécurité, une fonction de barrière de contrôle (CBF) robuste borne les écarts autorisés, mais ce type de garantie exige normalement de connaître à l'avance l'amplitude maximale des perturbations, ce qui rend le système inutilement prudent en pratique. Les auteurs contournent cette limite avec de la prédiction conforme par fenêtre glissante, une méthode statistique sans hypothèse sur la distribution des données, qui réestime en continu cette borne. Résultat annoncé : une précision de suivi de trajectoire de l'ordre du millimètre et un contrôle sûr en temps réel cadencé à 1 kHz, y compris face à des perturbations variées appliquées pendant les essais.

Pour l'industrie de la manipulation robotique, ce travail s'attaque à un compromis connu entre robustesse et précision : les contrôleurs purement basés modèle se dégradent dès que la dynamique réelle s'écarte du modèle théorique, tandis que les approches par apprentissage de résidus, plus adaptatives, manquent de garanties formelles et complexifient le déploiement. En combinant les deux logiques via une méthode d'incertitude calibrée statistiquement plutôt qu'un réseau de neurones supplémentaire, l'approche vise des applications où bras redondants et humains partagent le même espace de travail, un enjeu central pour la cobotique industrielle et l'intégration en environnement contraint.

Ce résultat s'inscrit dans une lignée de recherches cherchant à rendre les garanties de sécurité robotique moins conservatrices sans sacrifier la rigueur théorique, un problème classique des CBF robustes qui, mal calibrées, paralysent le mouvement autant qu'elles le sécurisent. L'usage de la prédiction conforme, technique empruntée au machine learning statistique, plutôt que de l'apprentissage de résidus par réseau de neurones, marque une différence d'approche notable. Il s'agit pour l'instant d'un résultat expérimental publié sur arXiv (2607.00424), validé sur un seul bras robotique en laboratoire, sans indication de transfert vers un produit ou un déploiement industriel.

À lire aussi

Barrières neuronales dans l'espace de configuration pour la planification et le contrôle de manipulation
1arXiv cs.RO 

Barrières neuronales dans l'espace de configuration pour la planification et le contrôle de manipulation

Des chercheurs proposent, dans un préprint arXiv (référence 2503.04929, troisième version, mars 2025), une méthode unifiée de planification de trajectoire et de contrôle sécurisé pour bras manipulateurs à haute dimensionnalité en environnement encombré et dynamique. Le coeur de l'approche repose sur l'apprentissage d'une fonction de distance en espace de configuration (CDF, Configuration-space Distance Function) via un réseau de neurones, utilisée simultanément comme outil de vérification de collision pendant la planification et comme barrière de sécurité en temps réel pendant le contrôle. Les expériences matérielles ont été réalisées sur un xArm6 d'UFactory, un manipulateur à 6 degrés de liberté vendu autour de 2 000 dollars, en conditions réelles. Le système ne s'appuie que sur des observations de nuages de points (point-cloud) embarquées, sans infrastructure de perception externe. La planification de trajectoire pour bras multi-axes en environnement non structuré repose classiquement sur des vérifications de collision nombreuses et coûteuses : chaque configuration candidate est testée contre un modèle de l'environnement. La CDF barrier réduit significativement ce nombre d'opérations en approximant localement l'espace libre en configuration. L'apport le plus concret pour les intégrateurs est ailleurs : un réseau de neurones introduit des erreurs de modélisation, et les capteurs ajoutent inévitablement du bruit. La formulation "distributivement robuste" retenue par les auteurs ne suppose aucune distribution statistique connue pour ces incertitudes, ce qui la rend applicable sans calibration préalable fine dans des scénarios industriels réels. C'est une réponse directe au fossé souvent observé entre performances en simulation et comportement effectif sur matériel, particulièrement critique pour des applications de manipulation en cellule dynamique. Ce travail s'inscrit dans une tendance accélérée à remplacer les représentations géométriques analytiques (maillages, distances signées calculées) par des représentations apprises en espace de configuration. Les Control Barrier Functions (CBFs), dont les CDF barriers constituent une extension neurale, sont issues de la théorie du contrôle formel et font l'objet d'un intérêt croissant depuis cinq ans. Parmi les approches concurrentes pour accélérer la vérification de collision : cuRobo de NVIDIA, VAMP (basé sur la décomposition convexe), ou les champs de distance signée neuronaux comme iSDF. Le choix du xArm6, bras commercial accessible et reproductible, renforce la portée pratique des résultats. L'existence d'une troisième version du préprint suggère des révisions substantielles en cours ; une soumission à ICRA ou RSS 2026 apparaît probable.

RecherchePaper
1 source
Contrôle robuste aux distributions via l'inférence de Stein pour la manipulation au contact
2arXiv cs.RO 

Contrôle robuste aux distributions via l'inférence de Stein pour la manipulation au contact

Une équipe de chercheurs publie sur arXiv (référence 2605.19029) une méthode de contrôle robuste pour la manipulation robotique en contact riche, domaine couvrant la saisie, l'assemblage et l'insertion précise d'objets. Le travail formalise le problème comme une optimisation de contrôle robuste aux distributions (distributionally robust control), résolue via l'inférence variationnelle de Stein, une technique probabiliste déterministe issue du machine learning bayésien. Les contrôleurs qui en résultent modélisent explicitement l'incertitude paramétrique liée aux contacts, sans nécessiter les volumes massifs de données d'entraînement qu'exigent les approches data-driven modernes. Les résultats expérimentaux rapportés indiquent une robustesse améliorée jusqu'à un facteur 3 par rapport aux méthodes classiques à base de modèles, sur une gamme de tâches avec incertitude paramétrique large. Ce chiffre est à nuancer : il provient des propres benchmarks des auteurs, sans validation indépendante. La manipulation en contact riche reste l'un des goulots d'étranglement critiques pour le déploiement de robots industriels polyvalents. Les approches VLA (Vision-Language-Action models), comme pi-0 de Physical Intelligence, offrent une flexibilité remarquable mais se dégradent fortement lorsque les données d'entraînement sont rares, ce qui limite leur adoption dans des environnements industriels où les jeux de données sont difficiles à constituer. Les contrôleurs classiques à base de modèles, à l'inverse, sont computationnellement efficaces mais peinent à représenter l'incertitude task-sensitive, c'est-à-dire celle qui impacte réellement la performance sur une tâche précise. L'approche proposée tente de combler ce fossé en injectant une modélisation probabiliste flexible dans le cadre déterministe des contrôleurs classiques, un compromis potentiellement attractif pour les intégrateurs industriels cherchant fiabilité sans pipeline de données massif. Ce travail s'inscrit dans une tendance académique cherchant à réconcilier le model-based engineering (Boston Dynamics, ABB) et les learned policies (Physical Intelligence avec pi-0, Google DeepMind avec ses architectures GR00T-style). L'inférence variationnelle de Stein, popularisée par Liu et Wang en 2016, est ici adaptée au contrôle optimal, ce qui représente une contribution méthodologique notable. Le résumé disponible ne mentionne ni déploiements réels ni partenaires industriels, signalant clairement un stade de recherche fondamentale, probablement conduite en simulation ou sur bancs d'essai de laboratoire. Une validation sur des plateformes hardware standardisées comme les bras Franka Emika ou UR10, dont les propriétés de contact sont bien documentées, constituerait la prochaine étape logique avant toute perspective d'industrialisation.

RecherchePaper
1 source
MPC d'impédance avec estimation des perturbations pour le contrôle de main dextérique
3arXiv cs.RO 

MPC d'impédance avec estimation des perturbations pour le contrôle de main dextérique

Des chercheurs ont soumis en juin 2026 sur arXiv (réf. 2606.14606) un cadre de contrôle baptisé Impedance MPC pour doigts robotiques dextres, actuateur-agnostique, couvrant transmissions hydrauliques, câblées, pneumatiques, à corde torsadée et série-élastiques. Un préfiltrage algébrique réduit la dynamique tendineuse à un double intégrateur à coefficients constants, dont l'inverse du coût QP est précalculé hors ligne ; un horizon glissant de 10 pas tourne à 500 Hz avec contraintes dures sur les forces de contact (ISO/TS 15066), les limites d'actionnement et le jerk. Un filtre de Kalman augmenté, alimenté uniquement par encodeurs, annule l'erreur statique sous charge constante. Sur un prototype de doigt à actionnement hydraulique, le contrôleur atteint 0,5 mrad RMS, 0,1 mrad en régime permanent et 6,6 mrad en pic sous 1,5 Nm de couple de contact, soit 183×, 1500× et 23× meilleur que l'impédance classique à gain fixe ; la raideur réalisée s'étend de 18 à 323 Nm/rad selon la fréquence de mise à jour. En simulation MuJoCo, le cadre s'étend à une main LEAP à 16 DOF, récupérant en 0,7 s après une perturbation de saisie de 2,5 N. L'actuateur-agnosticisme est le principal atout pour les intégrateurs : une seule loi de commande couvre des architectures mécaniquement très hétérogènes sans retuning, réduisant le coût d'intégration sur des plateformes multi-actionneurs. La conformité native à l'ISO/TS 15066 dans la formulation du problème simplifie les validations pour le déploiement cobotique en environnement humain, là où les forces de contact sont réglementées. Il faut cependant relativiser les gains annoncés, dont le plus élevé atteint 1500× : la référence est un contrôleur à gain fixe, choix délibérément défavorable, et des benchmarks contre du MPC adaptatif ou du contrôle par apprentissage sont absents de l'article. La main dextre reste le maillon faible de la robotique humanoïde : Shadow Robotics, Inspire Robots et d'autres ont progressé sur le plan mécanique, mais le contrôle fin sous contact demeure un problème ouvert. Les mains LEAP, issues de Carnegie Mellon, constituent la plateforme open-source de référence pour la recherche en manipulation. Les approches concurrentes privilégient l'apprentissage par renforcement et les architectures VLA (vision-langage-action), qui court-circuitent le contrôle classique au prix des garanties formelles ; cet article occupe l'angle inverse, avec des propriétés de stabilité et de faisabilité récursive héritées du cadre pHRI (interaction physique humain-robot). Aucun partenaire industriel ni calendrier de transfert n'est mentionné ; la contribution reste académique, mais elle outille directement les équipes intégrant des mains dextres sur des humanoïdes commerciaux comme ceux de Figure AI ou Unitree.

UELa conformité native à l'ISO/TS 15066 inscrite dans la formulation du contrôleur simplifie les validations réglementaires pour le déploiement cobotique en environnements humains en Europe, où les forces de contact sont normativement encadrées.

RecherchePaper
1 source
TAM : Module d'adaptation du couple pour un transfert de mouvement robuste en manipulation
4arXiv cs.RO 

TAM : Module d'adaptation du couple pour un transfert de mouvement robuste en manipulation

Des chercheurs ont publié sur arXiv (arXiv:2606.06218) le Torque Adaptation Module (TAM), un module appris qui corrige les commandes de couple envoyées au robot pour aligner son comportement sur celui d'un robot de référence idéal. TAM s'insère entre le contrôleur bas niveau et l'interface couple du robot, et opère via deux composants : un encodeur d'historique proprioceptif, qui compresse les états mécaniques récents en représentation latente, et un adaptateur de couple calculant des corrections résiduelles en temps réel. L'évaluation porte sur un bras Franka Panda réel, en transfert zéro-shot, sur trois tâches de manipulation dynamique : un pushing de boîte guidé par vision (apprentissage par renforcement), un retournement d'objet par imitation comportementale (BC), et un équilibrage balle-sur-plateau par MPC. Le problème adressé est structurant pour l'industrialisation robotique : une politique entraînée sur un robot se dégrade sur une autre instance du même modèle, ou lors d'un changement de charge utile non caractérisée. En manipulation de contact dynamique, un écart de timing de quelques millisecondes suffit à rompre la séquence de contact et faire échouer la tâche. TAM décharge la politique de toute domain randomization sur les paramètres dynamiques du robot, technique qui produit habituellement des comportements trop conservateurs. Sa propriété clé est l'indépendance vis-à-vis de l'espace d'action : les mêmes poids TAM s'appliquent indifféremment à des politiques en cibles articulaires, en cibles d'effecteur terminal, ou en couples directs, ce qui élargit considérablement la portée de réutilisation. En benchmark, TAM surpasse l'identification de système en ligne et la baseline RMA (Rapid Motor Adaptation). La transférabilité inter-robots constitue l'un des obstacles majeurs à la mise à l'échelle des déploiements industriels. Les approches classiques présentent des compromis bien documentés : la domain randomization sacrifie la performance, la system identification exige des données collectées pour chaque robot ou configuration. TAM propose une troisième voie via un préentraînement multi-robot en simulation randomisée, suivi d'un fine-tuning robot-spécifique sans aucune donnée réelle. L'idée d'adaptation par historique proprioceptif avait été popularisée par RMA autour de 2021 pour les robots quadrupèdes ; TAM l'étend à la manipulation de contact en bras articulé, domaine où la dynamique est nettement plus imprévisible. L'article ne mentionne ni partenaire industriel ni timeline de déploiement : il s'agit d'un travail académique dont la validation à plus grande échelle et sur robots variés reste à établir.

RecherchePaper
1 source