Aller au contenu principal
VBT-MPC : commande prédictive tactile à base de vision pour le suivi de contour
RecherchearXiv cs.RO6sem

VBT-MPC : commande prédictive tactile à base de vision pour le suivi de contour

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (2605.20392) un framework de contrôle prédictif baptisé VBT-MPC (Vision-Based Tactile Model Predictive Control), conçu pour le suivi de contours en manipulation robotique. Le système repose sur un capteur tactile à vision embarquée (VBTS, Vision-Based Tactile Sensor) monté en configuration eye-in-hand, c'est-à-dire fixé au poignet du robot de façon à co-localiser la perception et l'action. La contribution centrale est que le contrôleur MPC opère directement dans l'espace des descripteurs de contour extraits du capteur, sans passer par un module intermédiaire d'estimation de pose ni par une architecture de contrôle en effort dédiée. Les expériences couvrent des objets aux géométries et matériaux variés, évalués à la fois en simulation et en conditions réelles, avec comparaison systématique contre des stratégies de visual servoing adaptées aux features tactiles.

Ce travail s'attaque à un verrou concret du suivi de surface industriel : maintenir un contact calibré tout en longeant un contour exige traditionnellement soit un estimateur de pose précis (coûteux en calcul et sensible aux erreurs de modèle), soit un contrôleur en force complexe. En faisant du MPC un contrôleur natif dans l'espace tactile, les auteurs réduisent la chaîne de traitement et potentiellement la latence de réaction. Pour un intégrateur ou un COO industriel, cela pointe vers des applications d'inspection de surface, de meulage ou d'assemblage de précision où la robustesse au glissement et aux irrégularités géométriques est critique. La comparaison avec le visual servoing tactile permet de quantifier le gain du MPC sur l'horizon de prédiction face à une loi de commande réactive pure, ce qui est une donnée utile pour le choix d'architecture.

Les capteurs tactiles à vision (GelSight du MIT, DIGIT de Meta/CMU, Allsight, Soft-bubble) ont connu une forte montée en maturité depuis 2019, permettant d'extraire des champs de déformation et des features géométriques à haute résolution sans marqueurs. L'intégration du MPC à ce type de sensing prolonge des travaux antérieurs sur le contrôle en force/contact, mais substitue la mesure de force par une information visuelle riche et moins coûteuse en capteurs. Côté concurrence académique, des équipes comme CMU Robotics, Berkeley AUTOLAB et ETH Zurich RSL explorent des approches comparables (apprentissage par imitation tactile, diffusion policies avec retour haptique). La prochaine étape naturelle pour ce type de framework serait l'intégration dans des pipelines de manipulation généralistes ou des bancs d'inspection automatisée, potentiellement combinée avec des VLA (Vision-Language-Action models) pour la planification de haut niveau.

À lire aussi

Génération de code et contraintes coniques pour la commande prédictive sur microcontrôleurs avec Conic-TinyMPC
1arXiv cs.RO 

Génération de code et contraintes coniques pour la commande prédictive sur microcontrôleurs avec Conic-TinyMPC

Une équipe de chercheurs a publié Conic-TinyMPC, une extension du solveur embarqué TinyMPC qui ajoute le support des contraintes coniques du second ordre (SOCP) et la génération automatique de code C++ depuis Python, MATLAB et Julia. Sur microcontrôleurs à ressources limitées, le solveur atteint un gain de vitesse de 10,6x à 142,7x par rapport aux meilleurs solveurs embarqués existants sur des problèmes QP et SOCP, soit jusqu'à deux ordres de grandeur, tout en autorisant des problèmes un ordre de grandeur plus grands en mémoire. La validation matérielle a été conduite sur un quadrirotor Crazyflie de 27 grammes, en suivi de trajectoire avec des contraintes coniques actives sur le système réel, et le code est disponible en open source sur tinympc.org. Ces résultats changent concrètement l'équation du déploiement du MPC sur matériel embarqué. Le contrôle prédictif de modèle (MPC) est la méthode de référence pour les systèmes robotiques sous contraintes, mais son exécution en temps réel reste difficile sur des microcontrôleurs à faible coût et faible consommation. Les contraintes coniques, plus expressives que les alternatives linéaires, alourdissent encore le calcul, rendant leur usage sur matériel léger quasi impraticable avec les solveurs actuels. Conic-TinyMPC contourne ce problème en exploitant une structure ADMM (Alternating Direction Method of Multipliers) avec des matrices mises en cache, réduisant drastiquement le coût de calcul à l'exécution. La génération de code automatique depuis Python, MATLAB ou Julia réduit également la friction d'intégration, rendant l'outil accessible à des équipes industrielles sans expertise poussée en optimisation convexe. TinyMPC est né de travaux visant à porter des solveurs MPC rapides sur des plateformes embarquées contraintes, avec une première démonstration sur Crazyflie ayant établi la viabilité de l'approche sur des robots ultra-légers. Conic-TinyMPC en est l'évolution directe, intégrant les cônes du second ordre à un noyau déjà optimisé et se positionnant face à des solveurs comme OSQP, ECOS ou ACADOS, qui peinent à tenir dans les enveloppes mémoire et temporelles des microcontrôleurs bas de gamme. Les prochaines étapes naturelles consisteront à valider l'approche sur des systèmes plus complexes, bras manipulateurs ou robots bipèdes, où les contraintes coniques modélisent des cônes de friction ou des enveloppes de sécurité formelles.

RecherchePaper
1 source
DART : commande prédictive augmentée par apprentissage pour la manipulation bi-bras non préhensile
2arXiv cs.RO 

DART : commande prédictive augmentée par apprentissage pour la manipulation bi-bras non préhensile

Des chercheurs ont publié sur arXiv (référence 2604.17833) les travaux autour de DART, un framework bimanuel conçu pour la manipulation non préhensile d'objets posés sur un plateau. L'approche repose sur un contrôleur prédictif non linéaire (MPC) couplé à un contrôleur d'impédance par optimisation, permettant de déplacer des objets sur le plateau sans les saisir directement. Le système évalue trois stratégies de modélisation de la dynamique plateau-objet : un modèle analytique physique, un modèle par régression en ligne adaptatif en temps réel, et un modèle de dynamique entraîné par apprentissage par renforcement (RL), ce dernier offrant une meilleure généralisation sur des objets aux propriétés variées. Les évaluations ont été réalisées en simulation sur des objets de masses, géométries et coefficients de friction différents. Les auteurs revendiquent que DART constitue le premier framework dédié à ce type de tâche en configuration bimanuelle. L'intérêt technique de DART réside dans la comparaison rigoureuse des trois approches de modélisation sur des métriques concrètes : temps de stabilisation, erreur en régime permanent, effort de contrôle et généralisation. Ce benchmark interne est utile pour les équipes d'intégration robotique qui doivent choisir entre modèles physiques (précis mais rigides), adaptation en ligne (réactive mais computationnellement coûteuse) et RL (flexible mais plus difficile à certifier). L'association MPC et contrôleur d'impédance est une piste crédible pour la manipulation d'objets fragiles ou instables, un verrou important en robotique de service. Toutefois, la validation reste strictement en simulation : le passage au réel implique des défis de perception, de latence et de calibration que le papier ne traite pas encore. Ce travail s'inscrit dans un intérêt croissant pour la robotique de service en hôtellerie et restauration, où des acteurs comme Bear Robotics (Servi), Keenon Robotics ou encore Enchanted Tools (Miroki, développé en France) positionnent leurs plateformes sur des tâches de transport et de service en salle. Les approches dominantes jusqu'ici privilégient la navigation autonome avec préhension classique ; la manipulation non préhensile sur plateau reste peu explorée à l'échelle produit. La prochaine étape naturelle pour DART serait une validation sur plateforme physique, avec des bras commerciaux type Franka Research 3 ou Universal Robots, avant d'envisager une intégration dans un robot mobile de service.

UEEnchanted Tools (Miroki, France) est cité comme acteur du service robotique susceptible de bénéficier de ce type de manipulation non préhensile sur plateau, mais le travail reste en simulation sans transfert réel annoncé.

RecherchePaper
1 source
Commande prédictive par modèle à impédance corps entier pour l'interaction physique humain-robot sûre sur base flottante
3arXiv cs.RO 

Commande prédictive par modèle à impédance corps entier pour l'interaction physique humain-robot sûre sur base flottante

Des chercheurs ont publié sur arXiv (réf. 2606.14617, juin 2026) une architecture de contrôle à trois niveaux pour robots à base flottante - bipèdes et humanoïdes - conçue pour maintenir l'équilibre tout en tolérant l'interaction physique soutenue avec des opérateurs humains (pHRI, physical human-robot interaction). Le premier niveau est un MPC centroïdal qui planifie les forces de contact sur un horizon de 500 millisecondes. Le deuxième est un contrôleur corps entier (WBC) qui traduit l'équilibre en couples articulaires par projection dans l'espace nul cohérente avec les contraintes de contact. Le troisième est un programme quadratique (QP) à horizon fuyant qui prédit et rejette les perturbations de contact à l'aide d'un état augmenté par filtre de Kalman. Une linéarisation par retour d'état réduit la dynamique de l'effecteur à un double intégrateur à matrice constante dans chaque mode de contact, permettant une précalculation hors-ligne des matrices de coût et une exécution à plus de 1 kHz. Les validations ont été conduites en simulation sur un biped à 17 degrés de liberté et sur l'humanoïde Unitree G1. L'apport central est une garantie formelle d'erreur nulle en régime permanent sous des forces de contact humain soutenues et bornées - une limite connue des contrôleurs WBC à gain fixe, qui accumulent une dérive statique lorsqu'un opérateur guide ou pousse le robot en continu. La cadence à 1 kHz, rendue possible par la précalculation hors-ligne, s'inscrit dans les contraintes temps réel de la robotique industrielle. Un théorème d'équivalence d'impédance établit que la limite horizon infini du contrôleur retrouve une loi d'impédance classique en espace tâche, avec masse, amortissement et raideur effectifs qui s'adaptent automatiquement à la posture et à la configuration de contact - ce qui facilite le réglage intuitif pour des ingénieurs familiers des contrôleurs d'impédance conventionnels. Ce travail étend une architecture Impedance MPC à deux couches pour base fixe publiée antérieurement par les mêmes auteurs. Le passage à la base flottante est non trivial : le robot doit simultanément gérer sa propre stabilité dynamique et absorber les perturbations externes. L'Unitree G1, humanoïde commercialisé autour de 16 000 dollars par Unitree Robotics, sert de banc de validation en simulation. Il faut souligner que l'ensemble des résultats est simulé - aucun essai physique sur robot réel n'est rapporté, ce qui constitue l'étape attendue. Dans un paysage où Boston Dynamics (Atlas), Agility Robotics (Digit) et Figure (03) développent leurs propres solutions WBC pour la coopération humain-robot, cette approche apporte une contribution méthodologique formellement fondée, mais dont la robustesse en conditions réelles reste à démontrer.

RecherchePaper
1 source
Approximation de la sécurité sans oracle de sécurité via la commande prédictive par modèle
4arXiv cs.RO 

Approximation de la sécurité sans oracle de sécurité via la commande prédictive par modèle

Des chercheurs ont publié sur arXiv (référence 2510.20955v2) un algorithme permettant de vérifier la sécurité des décisions d'un robot mobile sans disposer d'un oracle de sécurité formel. Les approches classiques exigent soit des contraintes explicitement modélisées, soit des données annotées manuellement comme sûres ou dangereuses, deux méthodes coûteuses en ingénierie et sources d'erreurs. L'algorithme proposé contourne ce besoin via un simulateur : avant d'exécuter une action, le système la projette dans le simulateur vers un état futur, puis utilise l'algorithme Model-Predictive Path Integral (MPPI) pour vérifier l'existence d'un chemin de retour vers un état antérieur de la trajectoire. Sous une hypothèse d'invariance positive sur l'espace des états dangereux, si ce chemin de retour existe, l'état courant est mathématiquement garanti hors de la zone à risque. Les expériences montrent que la méthode approche les performances d'un oracle réel, en limitant notamment les faux négatifs, c'est-à-dire les cas où un état dangereux serait classifié à tort comme sûr. L'enjeu pratique est réel pour le déploiement des AMR (Autonomous Mobile Robots) en environnements industriels non structurés. La dépendance aux annotations manuelles de sécurité constitue un goulot d'étranglement majeur : chaque changement de site ou de configuration peut invalider les contraintes précédemment formulées. En exploitant les contraintes implicites déjà encodées dans les simulateurs physiques modernes, cette approche rend les systèmes de contrôle sûr plus généralisables, sans réécriture à chaque nouveau déploiement. Éliminer les faux négatifs est critique : c'est le scénario où un robot exécute une action jugée sûre à tort, avec des conséquences potentiellement irréversibles en conditions réelles. MPPI est un algorithme de planification par échantillonnage stochastique, initialement développé à Georgia Tech dans les travaux de Grady Williams et Evangelos Theodorou, et depuis repris dans de nombreux travaux sur la navigation autonome et les véhicules sans conducteur. Son utilisation ici comme outil de vérification de réversibilité plutôt que de planification directe constitue l'originalité méthodologique centrale de la contribution. Le travail s'inscrit dans un courant de recherche actif sur la sécurité sans supervision dense, aux côtés des Control Barrier Functions (CBF) appris par données et du safe reinforcement learning. L'article reste une contribution académique avec résultats en simulation uniquement, sans partenaire industriel ni déploiement annoncé. La prochaine étape naturelle serait une validation sur hardware réel dans des environnements aux contraintes implicites complexes et une comparaison quantitative avec des méthodes CBF classiques sur des benchmarks standardisés.

RecherchePaper
1 source