Aller au contenu principal
RecherchearXiv cs.RO38min

Robots à bras multiples : apprentissage neuronal de l'accessibilité Hamilton-Jacobi pour la planification décentralisée de trajectoires sûres

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs propose NeHMO, une méthode d'apprentissage par réseau de neurones basée sur la réductibilité de Hamilton-Jacobi (HJR) pour la planification de mouvement multi-bras en sécurité et de façon décentralisée. Le papier, publié sur arXiv (arXiv:2507.13940, version 2), s'attaque au problème de la coordination de plusieurs bras robotiques évoluant dans un espace de configuration couplé et de haute dimension. Plutôt que de s'appuyer sur un planificateur centralisé qui coordonne tous les bras mais peine à passer à l'échelle en temps réel, ou sur des méthodes décentralisées existantes qui supposent un comportement prévisible des autres bras, les auteurs entraînent une fonction de valeur de sécurité qui capture les contraintes de collision inter-bras dans le pire des cas. Cette représentation apprise alimente ensuite un module d'optimisation de trajectoire décentralisé, exécutable en temps réel sur chaque bras indépendamment.

L'enjeu dépasse l'exercice académique: la planification multi-bras sûre est un goulot d'étranglement concret pour les cellules de fabrication et les postes d'assemblage où plusieurs manipulateurs partagent un espace de travail restreint. Les approches centralisées classiques deviennent impraticables dès que le nombre de bras augmente, tandis que les méthodes décentralisées à base d'apprentissage profond échouent dès qu'un bras voisin dévie d'un comportement anticipé, c'est à dire exactement le scénario que redoutent les intégrateurs industriels en environnement non coopératif. En garantissant une sécurité dans le pire des cas plutôt qu'une prédiction probable de comportement, NeHMO répond à une limite reconnue des architectures actuelles: la fragilité face à l'imprévisibilité, sans sacrifier le passage à l'échelle.

La réductibilité de Hamilton-Jacobi est un outil classique de la théorie du contrôle pour la vérification formelle de sécurité, historiquement trop coûteux en calcul pour des systèmes multi-bras à haute dimension. L'apport ici est de le rendre tractable via une approximation neuronale, généralisable à différentes configurations de manipulateurs sans réentraînement complet. Selon les auteurs, la méthode surpasse les références de l'état de l'art sur des tâches de planification multi-bras jugées difficiles. Il s'agit toutefois d'un résultat de recherche publié en preprint, sans partenaire industriel ni déploiement annoncé à ce stade.

Dans nos dossiers

À lire aussi

Accessibilité de Hamilton-Jacobi contrainte par variété pour planification de mouvement multi-agents décentralisée
1arXiv cs.RO 

Accessibilité de Hamilton-Jacobi contrainte par variété pour planification de mouvement multi-agents décentralisée

Des chercheurs en robotique publient une nouvelle version (v2) d'un article arXiv intitulé "Manifold-constrained Hamilton-Jacobi Reachability Learning for Decentralized Multi-Agent Motion Planning" (arXiv:2511.03591), qui propose une méthode pour planifier les mouvements de plusieurs robots de façon sûre et décentralisée tout en respectant des contraintes géométriques imposées par la tâche elle-même. L'exemple donné par les auteurs est celui d'un robot de service qui doit porter une tasse bien droite, sans la renverser, tout en évitant des collisions avec des humains ou d'autres robots présents dans la même zone. Pour résoudre ce problème, l'équipe combine l'apprentissage par accessibilité de Hamilton-Jacobi, une technique mathématique servant à calculer les zones qu'un système peut atteindre en toute sécurité, avec des contraintes dites de variété (manifold), qui formalisent les gestes ou postures que la tâche impose. Ce calcul de sécurité contrainte est ensuite intégré dans un planificateur de trajectoires décentralisé, c'est-à-dire que chaque robot planifie ses propres mouvements sans connaître à l'avance la stratégie des autres agents. Pour l'industrie robotique, l'enjeu dépasse la simple prouesse académique: la plupart des planificateurs multi-agents actuels garantissent soit la sécurité, soit le respect d'une contrainte de tâche, rarement les deux simultanément à haute vitesse et en environnement dynamique. Une méthode capable de tenir les deux à la fois, tout en restant assez rapide pour un usage temps réel, intéresse directement les concepteurs de flottes de robots mobiles autonomes (AMR) en entrepôt, les fabricants de robots de service et les équipes qui développent des bras manipulateurs coopératifs, où un geste manqué ou une collision a un coût opérationnel direct. L'article s'inscrit dans la lignée des travaux récents sur la planification de mouvement multi-agents décentralisée pour systèmes à haute dimension, un domaine qui peine historiquement à intégrer des contraintes de tâche complexes sans hypothèses fortes sur le comportement des autres agents. Les auteurs affirment que leur approche généralise à des tâches variées et passe à l'échelle sur des problèmes de manipulation multi-agents en haute dimension, en dépassant les planificateurs contraints existants sur des bancs d'essai internes, une performance à nuancer puisqu'elle repose sur des comparaisons choisies par l'équipe elle-même. Une démonstration vidéo accompagne la publication.

RecherchePaper
1 source
Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots
2arXiv cs.RO 

Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots

Des chercheurs ont publié sur arXiv (référence 2504.17679) un framework de navigation intérieure combinant deux familles d'algorithmes jusqu'ici utilisées séparément : la reachability hamiltonienne-jacobienne (HJ), calculée hors-ligne, et la recherche sur graphe, exécutée en ligne. Le principe : les fonctions de valeur HJ, précomputées sur la géométrie de l'environnement, servent à la fois d'heuristiques informatives et de contraintes de sécurité proactives pour guider la recherche sur graphe en temps réel. Le système a été validé en simulation extensive et dans des expériences en conditions réelles, incluant des environnements avec présence humaine. Aucun modèle de robot spécifique ni aucune entreprise commerciale ne sont mentionnés dans la publication, qui s'inscrit dans un cadre académique pur. L'intérêt principal de cette approche réside dans la gestion du compromis entre sécurité garantie et efficacité computationnelle, un point de friction classique pour les robots mobiles en intérieur (AMR, plateformes logistiques). La reachability HJ offre des garanties théoriques solides sur l'évitement d'obstacles, mais elle souffre d'une limitation structurelle : elle suppose une connaissance complète de l'environnement, ce qui la rend difficilement applicable à des espaces dynamiques ou partiellement inconnus. En intégrant la reachability comme heuristique plutôt que comme planificateur principal, les auteurs contournent cette contrainte tout en amortissant le coût de calcul en ligne. Les résultats annoncés montrent une amélioration consistante face aux méthodes de référence, tant en efficacité de planification qu'en sécurité, mais les métriques précises (temps de cycle, taux de collision) ne sont pas détaillées dans le résumé disponible. La reachability HJ est un outil issu de la théorie du contrôle optimal, historiquement utilisé pour la vérification formelle de systèmes cyber-physiques. Son application à la robotique mobile n'est pas nouvelle, mais son couplage avec des algorithmes de recherche sur graphe type A* pour surmonter la contrainte de connaissance globale de l'environnement représente une direction de recherche active. Ce travail se positionne face aux approches purement apprentissage (VLA, politiques end-to-end) en revendiquant des garanties formelles absentes des méthodes neuronales. Les prochaines étapes naturelles incluent l'extension à des espaces 3D ou à des robots non-holonomes, ainsi qu'une validation sur des plateformes industrielles réelles.

RecherchePaper
1 source
Planification unifiée de trajectoires multi-contacts pour les robots à déplacement roulant
3arXiv cs.RO 

Planification unifiée de trajectoires multi-contacts pour les robots à déplacement roulant

Des chercheurs ont publié sur arXiv (ref. 2606.29065) un cadre unifié de planification de trajectoire pour les robots à roulement multi-contacts sous contraintes de non-glissement. Le problème central est la planification de mouvement dans des systèmes où plusieurs corps sphériques roulent simultanément sans glisser, ce qui génère des contraintes non-holonomes couplées et une configuration évoluant sur une variété courbe. Le framework proposé repose sur la formulation de Montana en coordonnées de contact, où chaque point de contact est représenté par un vecteur d'état à cinq dimensions. Sur cette base géométrique, les auteurs construisent une carte routière de type Voronoï directement sur la variété de contact sphérique, intègrent des obstacles en calotte sphérique et des zones d'exclusion mutuelle via une vérification de collision sur la variété, puis raffinent les chemins discrets par un lissage log-exp cohérent avec la géométrie différentielle. Les trajectoires lissées sont ensuite remontées en mouvements de roulement admissibles via la cinématique Montana et validées par simulation forward. Cette publication s'attaque à une lacune réelle en planification de mouvement : les approches classiques peinent à gérer simultanément les contraintes non-holonomes, la topologie des variétés de contact et la présence de plusieurs points de contact couplés. L'intégration d'un Voronoï directement sur la variété sphérique, plutôt que dans un espace euclidien aplati, est la contribution technique principale, car elle préserve la géométrie intrinsèque sans distorsions. Il convient cependant de noter que la validation reste purement simulée : aucune expérience sur plateforme physique n'est rapportée, ce qui constitue une limite explicitement reconnue par les auteurs. Le domaine des robots à roulement sphérique reste une niche académique, distinct des humanoïdes ou des AMR (robots mobiles autonomes) à roues classiques, mais pertinent pour des plateformes comme les robots à roulement omnidirectionnel ou les systèmes de manipulation interne par sphère. La cinématique de Montana, référence fondatrice des années 1980-90 en mécanique de contact, est ici réemployée comme socle formel. Les auteurs annoncent trois extensions futures : géométries non-sphériques, environnements à obstacles dynamiques, et validation expérimentale sur plateforme réelle. En l'état, il s'agit d'une contribution théorique solide, pas encore d'un outil intégrable en production industrielle.

RecherchePaper
1 source
Accessibilité différentiable parallèle pour l'apprentissage et la planification avec dynamiques neuronales et contrôleurs certifiés
4arXiv cs.RO 

Accessibilité différentiable parallèle pour l'apprentissage et la planification avec dynamiques neuronales et contrôleurs certifiés

Une équipe de recherche a publié en mai 2026 (arXiv:2605.25346) un cadre de vérification formelle parallélisable et différentiable pour systèmes robotiques pilotés par réseaux de neurones (NN). Implémenté en JAX pour exploiter le calcul GPU-batché, le framework combine la construction de "flowpipes" par modèles de Taylor avec la propagation de bornes linéaires de type CROWN, une technique issue de la vérification des NN adversariaux. Le résultat est une représentation unifiée qui préserve les dépendances affines tout en supportant la différentiation automatique. Sur cette base, les auteurs proposent deux applications concrètes : une méthode d'entraînement certifié qui pousse les modèles NN à produire des dynamiques "reachability-friendly", et un schéma de commande prédictive (MPC) combinant échantillonnage et raffinement par gradient. Les expériences couvrent la manipulation non préhensile (objets poussés sans saisie) et des drones quadrotors, avec des évaluations hardware et des systèmes allant jusqu'à 72 dimensions d'état. Le problème central que ce travail adresse est le fossé entre performance des NN et garanties formelles de sécurité : les outils de "reachability" existants (NNV, Veritex, CROWN-reach) produisent des sur-approximations valides des ensembles atteignables, mais sont trop lents pour être intégrés dans une boucle d'apprentissage ou de planification en ligne, et rarement différentiables. Rendre ce calcul GPU-compatible et différentiable ouvre la voie à une co-optimisation contrôleur/garantie, ce qui change la logique de déploiement : au lieu de vérifier après entraînement (post-hoc, coûteux), on certifie pendant l'entraînement. Pour les intégrateurs industriels et les équipes robotique, c'est un pas vers des robots NN-pilotés qui satisfont des contraintes de sécurité hard sans sacrifier la performance apprise. La vérification formelle pour les NN en robotique est un axe de recherche actif depuis 2018, porté notamment par les travaux CROWN (Zhang et al.), qui ciblaient initialement la robustesse adversariale en vision. L'extension à la dynamique continue et aux boucles fermées reste un problème ouvert, avec des groupes concurrents chez MIT, CMU et DeepMind. Ce preprint positionne JAX comme plateforme centrale pour ce type de pipeline hybride apprentissage/vérification, une tendance émergente face à PyTorch. Les prochaines étapes probables incluent des tests sur manipulateurs industriels à plus haute dimensionnalité et l'intégration dans des frameworks MPC embarqués.

UELa certification embarquée dans la boucle d'entraînement s'aligne directement avec les exigences de vérifiabilité formelle de l'AI Act pour les systèmes IA à haut risque (dont les robots industriels et autonomes), réduisant le coût de mise en conformité pour les équipes R&D européennes.

RecherchePaper
1 source