Aller au contenu principal
Génération de code et contraintes coniques pour la commande prédictive sur microcontrôleurs avec Conic-TinyMPC
RecherchearXiv cs.RO6sem

Génération de code et contraintes coniques pour la commande prédictive sur microcontrôleurs avec Conic-TinyMPC

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié Conic-TinyMPC, une extension du solveur embarqué TinyMPC qui ajoute le support des contraintes coniques du second ordre (SOCP) et la génération automatique de code C++ depuis Python, MATLAB et Julia. Sur microcontrôleurs à ressources limitées, le solveur atteint un gain de vitesse de 10,6x à 142,7x par rapport aux meilleurs solveurs embarqués existants sur des problèmes QP et SOCP, soit jusqu'à deux ordres de grandeur, tout en autorisant des problèmes un ordre de grandeur plus grands en mémoire. La validation matérielle a été conduite sur un quadrirotor Crazyflie de 27 grammes, en suivi de trajectoire avec des contraintes coniques actives sur le système réel, et le code est disponible en open source sur tinympc.org.

Ces résultats changent concrètement l'équation du déploiement du MPC sur matériel embarqué. Le contrôle prédictif de modèle (MPC) est la méthode de référence pour les systèmes robotiques sous contraintes, mais son exécution en temps réel reste difficile sur des microcontrôleurs à faible coût et faible consommation. Les contraintes coniques, plus expressives que les alternatives linéaires, alourdissent encore le calcul, rendant leur usage sur matériel léger quasi impraticable avec les solveurs actuels. Conic-TinyMPC contourne ce problème en exploitant une structure ADMM (Alternating Direction Method of Multipliers) avec des matrices mises en cache, réduisant drastiquement le coût de calcul à l'exécution. La génération de code automatique depuis Python, MATLAB ou Julia réduit également la friction d'intégration, rendant l'outil accessible à des équipes industrielles sans expertise poussée en optimisation convexe.

TinyMPC est né de travaux visant à porter des solveurs MPC rapides sur des plateformes embarquées contraintes, avec une première démonstration sur Crazyflie ayant établi la viabilité de l'approche sur des robots ultra-légers. Conic-TinyMPC en est l'évolution directe, intégrant les cônes du second ordre à un noyau déjà optimisé et se positionnant face à des solveurs comme OSQP, ECOS ou ACADOS, qui peinent à tenir dans les enveloppes mémoire et temporelles des microcontrôleurs bas de gamme. Les prochaines étapes naturelles consisteront à valider l'approche sur des systèmes plus complexes, bras manipulateurs ou robots bipèdes, où les contraintes coniques modélisent des cônes de friction ou des enveloppes de sécurité formelles.

À lire aussi

CommandSwarm : génération d'arbres de comportement en langage naturel pour essaims robotiques avec contraintes de sécurité
1arXiv cs.RO 

CommandSwarm : génération d'arbres de comportement en langage naturel pour essaims robotiques avec contraintes de sécurité

CommandSwarm est un pipeline qui convertit des commandes en langage naturel, vocales ou textuelles, en arbres de comportement (behavior trees, BT) au format XML pour piloter des essaims de robots. Publiée en mai 2026 sur arXiv (preprint 2605.07764), l'architecture enchaîne traduction multilingue, filtrage de sécurité au niveau commande, prompting contraint, un LLM adapté par LoRA, et un validateur déterministe basé sur une liste blanche de primitives d'essaim autorisées. Onze LLMs open source de 6,7 à 14 milliards de paramètres, tous quantifiés en 4 bits, ont été évalués : Falcon3-Instruct-10B et Mistral-7B-v3 ressortent comme les meilleurs candidats en few-shot prompting, avec des scores BLEU supérieurs à 0,60. Après adaptation LoRA sur un corpus synthétique de 2 063 paires instruction-BT, le Falcon3-Instruct-10B passe d'un BLEU zero-shot de 0,267 à 0,663, d'un ROUGE-L de 0,366 à 0,692, et d'une validité syntaxique acceptée par le parser de 0 % à 72 %. Pour le front-end multilingue, SeamlessM4T v2-large et EuroLLM-9B, initiative européenne, offrent le meilleur compromis qualité-latence. La conclusion opérationnelle centrale de ces travaux est que la qualité de génération seule est insuffisante pour un déploiement autonome : sans parser de validation et filtre de sécurité en sortie, même les meilleurs modèles produisent des plans non exécutables ou potentiellement dangereux. Pour les intégrateurs robotiques et les décideurs industriels, cela confirme que les garde-fous déterministes sont non négociables, quel que soit le score BLEU affiché par un modèle. La progression de 0 % à 72 % de validité syntaxique après fine-tuning souligne également que l'adaptation domaine-spécifique reste indispensable : aucun LLM généraliste, même performant, ne maîtrise spontanément la syntaxe XML des BTs robotiques. Les behavior trees se sont imposés depuis une dizaine d'années comme le paradigme de contrôle dominant en robotique avancée, supplantant les machines à états finis classiques. La commande par langage naturel rejoint une tendance de fond déjà illustrée par ProgPrompt (Microsoft/Stanford, 2022), SayCan (Google, 2022), et les VLAs Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) pour robots individuels. CommandSwarm se positionne sur le créneau des essaims multi-agents, où la coordination collective et les risques d'interférence rendent la validation formelle encore plus critique qu'en robotique unitaire. Ce travail reste à ce stade un preprint de recherche évalué sur scénarios de simulation ; aucun déploiement sur hardware physique n'est annoncé. Les prochaines étapes attendues comprennent des tests sur robots réels, l'évaluation de la latence temps-réel en conditions opérationnelles, et l'extension du corpus d'entraînement au-delà des 2 063 exemples synthétiques actuels.

UEEuroLLM-9B, initiative européenne, ressort comme l'un des meilleurs compromis qualité-latence pour le front-end multilingue, ce qui lui donne un avantage potentiel dans les projets robotiques financés ou réglementés en Europe.

RecherchePaper
1 source
VBT-MPC : commande prédictive tactile à base de vision pour le suivi de contour
2arXiv cs.RO 

VBT-MPC : commande prédictive tactile à base de vision pour le suivi de contour

Des chercheurs ont publié sur arXiv (2605.20392) un framework de contrôle prédictif baptisé VBT-MPC (Vision-Based Tactile Model Predictive Control), conçu pour le suivi de contours en manipulation robotique. Le système repose sur un capteur tactile à vision embarquée (VBTS, Vision-Based Tactile Sensor) monté en configuration eye-in-hand, c'est-à-dire fixé au poignet du robot de façon à co-localiser la perception et l'action. La contribution centrale est que le contrôleur MPC opère directement dans l'espace des descripteurs de contour extraits du capteur, sans passer par un module intermédiaire d'estimation de pose ni par une architecture de contrôle en effort dédiée. Les expériences couvrent des objets aux géométries et matériaux variés, évalués à la fois en simulation et en conditions réelles, avec comparaison systématique contre des stratégies de visual servoing adaptées aux features tactiles. Ce travail s'attaque à un verrou concret du suivi de surface industriel : maintenir un contact calibré tout en longeant un contour exige traditionnellement soit un estimateur de pose précis (coûteux en calcul et sensible aux erreurs de modèle), soit un contrôleur en force complexe. En faisant du MPC un contrôleur natif dans l'espace tactile, les auteurs réduisent la chaîne de traitement et potentiellement la latence de réaction. Pour un intégrateur ou un COO industriel, cela pointe vers des applications d'inspection de surface, de meulage ou d'assemblage de précision où la robustesse au glissement et aux irrégularités géométriques est critique. La comparaison avec le visual servoing tactile permet de quantifier le gain du MPC sur l'horizon de prédiction face à une loi de commande réactive pure, ce qui est une donnée utile pour le choix d'architecture. Les capteurs tactiles à vision (GelSight du MIT, DIGIT de Meta/CMU, Allsight, Soft-bubble) ont connu une forte montée en maturité depuis 2019, permettant d'extraire des champs de déformation et des features géométriques à haute résolution sans marqueurs. L'intégration du MPC à ce type de sensing prolonge des travaux antérieurs sur le contrôle en force/contact, mais substitue la mesure de force par une information visuelle riche et moins coûteuse en capteurs. Côté concurrence académique, des équipes comme CMU Robotics, Berkeley AUTOLAB et ETH Zurich RSL explorent des approches comparables (apprentissage par imitation tactile, diffusion policies avec retour haptique). La prochaine étape naturelle pour ce type de framework serait l'intégration dans des pipelines de manipulation généralistes ou des bancs d'inspection automatisée, potentiellement combinée avec des VLA (Vision-Language-Action models) pour la planification de haut niveau.

RecherchePaper
1 source
Planification par réseau de neurones en graphe et contrôle prédictif pour la planification de mouvement multi-robots sans étiquettes sous contraintes de communication
3arXiv cs.RO 

Planification par réseau de neurones en graphe et contrôle prédictif pour la planification de mouvement multi-robots sans étiquettes sous contraintes de communication

Une équipe de chercheurs propose, dans un preprint déposé sur arXiv le 25 mai 2026 (arXiv:2605.19209), un framework hiérarchique pour résoudre le problème de planification de mouvement multi-robots sans étiquetage, c'est-à-dire l'assignation simultanée de robots à des objectifs et la génération de trajectoires sûres dans des environnements partagés. Le système combine deux composants : un Graph ATtention Planner (GATP), fondé sur des réseaux de neurones à graphes avec mécanisme d'attention, qui génère des sous-objectifs intermédiaires par coopération entre agents, et un contrôleur NMPC (Nonlinear Model Predictive Controller) décentralisé, exécuté en embarqué sur chaque robot, qui garantit la faisabilité des trajectoires sous dynamiques non-linéaires et contraintes d'actuation réelles. Le framework a été évalué à la fois en simulation et sur des quadrotors physiques. Les auteurs rapportent une tolérance aux délais de communication allant jusqu'à 200 ms, une inférence entièrement décentralisée à bord, et une meilleure généralisation à des équipes de taille croissante. Ce travail s'attaque directement au gouffre sim-to-real qui mine la plupart des approches GNN appliquées à la robotique multi-agents : les méthodes existantes supposent des dynamiques simplifiées et un environnement de simulation idéalisé, ce qui les rend fragiles en conditions réelles. En couplant un planificateur neuronal décentralisé à un contrôleur à modèle prédictif, le framework maintient les propriétés de scalabilité des GNN tout en imposant des garanties de sécurité physiques que les approches purement apprises ne fournissent pas. La robustesse aux délais de communication est particulièrement significative pour les déploiements en entrepôts ou en milieu industriel, où les réseaux sans fil ne sont jamais idéaux. Cette contribution s'inscrit dans un corpus actif de recherche sur les GNN pour la coordination multi-robots, aux côtés de travaux comme MAGAT ou DAN, qui visent à remplacer les solveurs centralisés classiques (MILP, CBS) par des approches distribuées passant à l'échelle. Le preprint n'est pas encore soumis à une revue avec comité de lecture, et aucun déploiement industriel ni partenariat n'est annoncé : il s'agit d'une validation expérimentale académique sur quadrotors, prometteuse mais à consolider. Les prochaines étapes naturelles seraient des expériences sur flottes plus larges et des robots à dynamiques plus complexes, comme des manipulateurs mobiles ou des AMR en environnement entrepôt.

RecherchePaper
1 source
Commande prédictive convexe robuste avec garanties d'évitement de collision pour bras manipulateurs
4arXiv cs.RO 

Commande prédictive convexe robuste avec garanties d'évitement de collision pour bras manipulateurs

Des chercheurs présentent dans un pré-print arXiv (référence 2508.21677, troisième révision) une méthode de contrôle par modèle prédictif (MPC) conçue pour les bras manipulateurs industriels à 6 degrés de liberté (DOF) opérant dans des environnements encombrés. L'approche repose sur deux composantes : un tube MPC robuste, qui encapsule les trajectoires dans un tube garanti même en présence d'incertitudes paramétriques du modèle, et un algorithme de planification de corridor qui génère des chemins exemptes de collisions. La formulation qui en résulte est convexe, propriété rare dans ce domaine, ce qui permet une résolution rapide et compatible avec des boucles de contrôle temps réel. Validée uniquement en simulation, la méthode surpasse des approches de référence en tolérant des niveaux plus élevés d'incertitude de modèle tout en maintenant des vitesses d'exécution supérieures. Aucun déploiement matériel ni partenaire industriel n'est mentionné à ce stade. La portée industrielle de ce travail tient à un problème concret : les incertitudes de modèle dans les manipulateurs (charge variable, usure, flexibilité des joints) imposent aujourd'hui des limites de vitesse conservatives dans les cellules robotisées, ce qui réduit la cadence. Une méthode MPC offrant des garanties formelles de sécurité tout en réduisant ce conservatisme permettrait aux intégrateurs de pousser les vitesses nominales sans compromettre la conformité aux normes de sécurité (ISO 10218). La formulation convexe est ici un point-clé : elle rend le MPC compatible avec des solveurs rapides type QP (quadratic programming), là où les approches non-convexes nécessitent souvent des relaxations coûteuses ou des horizons de prédiction courts. Le contrôle prédictif pour manipulateurs est un axe de recherche actif depuis une décennie, avec des approches concurrentes incluant les MPC non-linéaires (via ACADO ou FORCES Pro), les méthodes basées sur les fonctions barrières de contrôle (CBF), ou encore les planificateurs par échantillonnage (MPPI). Ce travail se positionne sur la robustesse formelle et la rapidité de résolution, deux propriétés rarement combinées. La limite principale reste la validation purement simulée : le passage au réel (sim-to-real gap, flexibilité mécanique non modélisée, latences capteurs) n'est pas abordé. Les prochaines étapes naturelles seraient une validation sur hardware, par exemple sur un UR10 ou un KUKA LBR, et une extension à des horizons d'évitement dynamique face à des obstacles mobiles.

UELes intégrateurs et fabricants européens (ABB, KUKA) pourraient à terme exploiter cette méthode pour augmenter la cadence de leurs cellules sans compromettre la conformité ISO 10218, mais aucun partenariat ni déploiement européen n'est mentionné à ce stade.

RecherchePaper
1 source