Aller au contenu principal
RecherchearXiv cs.RO1h

HJ-SafeDMP : primitives de mouvement dynamiques guidées par Hamilton-Jacobi pour la sécurité certifiée du robot

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié sur arXiv (2506.28995) HJ-SafeDMP, un cadre algorithmique qui combine Dynamic Movement Primitives (DMP) et analyse de joignabilité Hamilton-Jacobi (HJ) pour garantir formellement la sécurité des trajectoires d'un robot. Les DMP assurent stabilité inhérente et généralisation de trajectoire depuis une seule démonstration humaine, mais sans certificat de sécurité formelle. HJ-SafeDMP apprend hors ligne une Control Barrier Value Function (CBVF) via une récursion HJ model-free à différences finies, puis la déploie comme filtre de sécurité en temps réel avec une loi de contrôle en forme fermée, sans résoudre de programme quadratique en ligne, contrairement aux approches CBF-QP classiques. Les expériences sur un manipulateur à 7 degrés de liberté (DOF) montrent une exécution plusieurs ordres de grandeur plus rapide que les baselines d'optimisation, avec garanties formelles d'évitement de collision et couverture probabiliste calibrée par prédiction conforme sur échantillon fini.

L'enjeu industriel est direct : les DMP sont prisés pour leur robustesse aux perturbations et leur flexibilité temporelle, mais ils n'offrent aucun certificat de sécurité. À l'inverse, l'analyse HJ Reachability fournit des marges de sécurité au pire cas (worst-case safety margins), mais souffre de la malédiction de la dimensionnalité, ce qui la rend impraticable pour le contrôle en temps réel sur des architectures robotiques réelles. HJ-SafeDMP résout ce compromis sans coût d'optimisation en ligne, le rendant compatible avec les boucles de contrôle rapides des robots industriels et cobots. La calibration par prédiction conforme apporte en outre une garantie probabiliste quantifiée, un argument potentiellement pertinent pour les processus de certification de sécurité fonctionnelle en contexte d'interaction humain-robot.

Les DMP ont été introduits au début des années 2000 par Stefan Schaal et sont restés une référence en apprentissage par imitation. Les méthodes CBF (Control Barrier Functions) constituent aujourd'hui le standard pour la sécurité temps réel, mais leur résolution QP à chaque pas de temps génère un goulot computationnel non négligeable. L'analyse HJ Reachability, portée notamment par la Berkeley HJ Reachability Toolbox, est théoriquement rigoureuse mais rarement déployée en temps réel faute de scalabilité sur des systèmes à haute dimensionnalité. HJ-SafeDMP s'en distingue aussi par un objectif d'apprentissage par expectile qui évite les requêtes hors distribution, un point de fragilité courant des approches offline. Il s'agit d'une contribution académique préliminaire : aucun partenaire industriel ni calendrier de déploiement en production n'est mentionné dans l'article.

Impact France/UE

Contribution indirectement pertinente pour les équipes R&D cobot européennes travaillant sur la certification de sécurité fonctionnelle (ISO 10218, AI Act), mais aucun acteur FR/EU impliqué et aucun déploiement industriel annoncé.

Dans nos dossiers

À lire aussi

Primitives de mouvement par le langage : ancrer les modèles de langage dans le mouvement robotique
1arXiv cs.RO 

Primitives de mouvement par le langage : ancrer les modèles de langage dans le mouvement robotique

Des chercheurs du Collaborative Robotics Lab de Virginia Tech ont publié Language Movement Primitives (LMP), un framework qui relie les modèles de vision-langage (VLM) aux Dynamic Movement Primitives (DMP), une famille de contrôleurs de trajectoire établie en robotique depuis les années 2000. Le principe: les DMP définissent des trajectoires continues et stables via un faible nombre de paramètres interprétables, et les VLM configurent ces paramètres directement à partir d'instructions en langage naturel. Testé sur 31 tâches de manipulation de bureau en conditions réelles, LMP atteint un taux de succès de 65%, contre 35% pour le meilleur système de référence évalué. Le pipeline fonctionne en mode zéro-shot, sans fine-tuning spécifique aux tâches cibles. L'article est disponible sur arXiv (2602.02839, troisième révision) et accompagné de vidéos de démonstration. Le vrai problème que LMP cible est le "grounding" moteur: transformer un raisonnement abstrait en commandes physiquement cohérentes. Les VLM comme GPT-4V excellent à décomposer une tâche en étapes logiques, mais produire des trajectoires exécutables reste hors de leur portée native. À l'inverse, les modèles de fondation robotique tels que Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA ou RT-2 de Google génèrent des actions directement, mais nécessitent généralement un fine-tuning coûteux en données in-domain pour s'adapter à de nouvelles tâches. LMP propose une troisième voie: les DMP servent d'interface structurée entre le raisonnement LLM et le contrôle bas niveau, préservant la stabilité dynamique sans apprentissage supplémentaire. Le gain de 30 points de pourcentage en zéro-shot sur des tâches réelles est notable, même si le choix des baselines et les conditions de test précises mériteront une vérification indépendante par la communauté. Les DMP ont été formalisés par Schaal et al. dans les années 2000 et restent un outil de référence pour la manipulation grâce à leur stabilité et leur capacité de généralisation. L'approche de LMP s'inscrit dans la lignée de SayCan (Google) et Code-as-Policies (Liang et al.), mais descend plus bas dans la pile de contrôle sans passer par un réseau de politique intermédiaire. Les concurrents directs sont les VLA bout-en-bout comme OpenVLA ou le récent Helix d'Figure AI, qui offrent plus de flexibilité mais restent tributaires de larges jeux de données de démonstration. Les prochaines étapes probables incluent l'extension à des environnements non-tabulaires et à des robots à plus haute dimensionnalité, notamment la manipulation dextre sur bras 7-DOF.

RechercheOpinion
1 source
Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots
2arXiv cs.RO 

Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots

Des chercheurs ont publié sur arXiv (référence 2504.17679) un framework de navigation intérieure combinant deux familles d'algorithmes jusqu'ici utilisées séparément : la reachability hamiltonienne-jacobienne (HJ), calculée hors-ligne, et la recherche sur graphe, exécutée en ligne. Le principe : les fonctions de valeur HJ, précomputées sur la géométrie de l'environnement, servent à la fois d'heuristiques informatives et de contraintes de sécurité proactives pour guider la recherche sur graphe en temps réel. Le système a été validé en simulation extensive et dans des expériences en conditions réelles, incluant des environnements avec présence humaine. Aucun modèle de robot spécifique ni aucune entreprise commerciale ne sont mentionnés dans la publication, qui s'inscrit dans un cadre académique pur. L'intérêt principal de cette approche réside dans la gestion du compromis entre sécurité garantie et efficacité computationnelle, un point de friction classique pour les robots mobiles en intérieur (AMR, plateformes logistiques). La reachability HJ offre des garanties théoriques solides sur l'évitement d'obstacles, mais elle souffre d'une limitation structurelle : elle suppose une connaissance complète de l'environnement, ce qui la rend difficilement applicable à des espaces dynamiques ou partiellement inconnus. En intégrant la reachability comme heuristique plutôt que comme planificateur principal, les auteurs contournent cette contrainte tout en amortissant le coût de calcul en ligne. Les résultats annoncés montrent une amélioration consistante face aux méthodes de référence, tant en efficacité de planification qu'en sécurité, mais les métriques précises (temps de cycle, taux de collision) ne sont pas détaillées dans le résumé disponible. La reachability HJ est un outil issu de la théorie du contrôle optimal, historiquement utilisé pour la vérification formelle de systèmes cyber-physiques. Son application à la robotique mobile n'est pas nouvelle, mais son couplage avec des algorithmes de recherche sur graphe type A* pour surmonter la contrainte de connaissance globale de l'environnement représente une direction de recherche active. Ce travail se positionne face aux approches purement apprentissage (VLA, politiques end-to-end) en revendiquant des garanties formelles absentes des méthodes neuronales. Les prochaines étapes naturelles incluent l'extension à des espaces 3D ou à des robots non-holonomes, ainsi qu'une validation sur des plateformes industrielles réelles.

RecherchePaper
1 source
Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques
3arXiv cs.RO 

Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques

Des chercheurs ont publié sur arXiv (ref. 2504.11901, cinquième version) un framework de prise de décision basé sur l'inférence causale pour les robots mobiles autonomes (AMR) évoluant dans des environnements partagés avec des humains. Plutôt que de s'appuyer uniquement sur des corrélations statistiques, leur système apprend un modèle causal explicite des dynamiques d'environnement, notamment l'estimation de la consommation batterie et les risques d'obstruction par des passants, pour décider quand et comment exécuter une tâche. Pour valider leur approche, l'équipe a développé PeopleFlow, un simulateur basé sur Gazebo capable de générer des trajectoires réalistes de multiples agents (humains et robots) en tenant compte de facteurs contextuels comme l'heure, la configuration spatiale et l'état du robot. Le cas d'usage principal est un entrepôt en activité partagée, benchmark face à une baseline non-causale classique. L'apport principal est de déplacer la logique de décision de la corrélation vers la causalité, une distinction non triviale en robotique opérationnelle. Là où un système standard détecte qu'il y a "souvent du monde à 14h dans l'allée B" et l'évite, un modèle causal comprend pourquoi, ce qui lui permet d'anticiper des situations nouvelles et de planifier la minuterie d'une tâche logistique en conséquence. Pour un COO gérant une flotte d'AMR dans un entrepôt mutualisé avec des préparateurs de commandes, cela se traduit potentiellement par moins d'arrêts non planifiés, une meilleure gestion de la charge batterie, et une cohabitation plus fluide. Il convient toutefois de noter que les résultats présentés sont exclusivement issus de simulation, sans validation terrain, ce qui constitue une limite importante à ce stade. Ce travail s'inscrit dans un contexte de déploiement croissant d'AMR dans des espaces mixtes, des entrepôts e-commerce aux hôpitaux, où des acteurs comme MiR (Teradyne), Locus Robotics ou le français Exotec font face à des défis de navigation sociale de plus en plus complexes. La recherche en planification causale reste largement académique, mais elle trace une voie complémentaire aux approches par apprentissage par renforcement ou par règles explicites. La prochaine étape logique serait une validation sur robot physique en environnement réel, un passage sim-to-real que l'article n'adresse pas encore.

UELes opérateurs français d'AMR comme Exotec, confrontés à la navigation en entrepôts partagés avec des préparateurs humains, sont le public cible naturel de ce framework, mais l'absence de validation terrain limite l'applicabilité immédiate.

RecherchePaper
1 source
Sécurité dynamique corps entier pour bras robotiques : fonctions de sécurité de Poisson 3D pour filtres de sécurité à base de CBF
4arXiv cs.RO 

Sécurité dynamique corps entier pour bras robotiques : fonctions de sécurité de Poisson 3D pour filtres de sécurité à base de CBF

Des chercheurs ont déposé sur arXiv (réf. 2604.21189) un cadre pour la sécurité plein-corps des bras manipulateurs robotiques en environnements dynamiques, combinant des fonctions de sécurité de Poisson en 3D (PSF) et des filtres basés sur des Control Barrier Functions (CBF). La méthode discrétise la surface du robot à une résolution paramétrable, puis contracte l'espace libre via une différence de Pontryagin proportionnelle à cette résolution. Sur ce domaine tamponné, une unique CBF globalement lisse est synthétisée en résolvant l'équation de Poisson sur l'ensemble de l'environnement. Les contraintes résultantes, évaluées à chaque point d'échantillonnage, sont appliquées en temps réel par un programme quadratique multi-contraintes. La validation est réalisée sur un manipulateur à 7 degrés de liberté (DOF) en environnement dynamique, seule donnée expérimentale concrète de ce preprint, sans benchmark de temps de cycle publié. L'apport est simultanément théorique et computationnel. Le travail prouve formellement que maintenir les points échantillonnés sûrs dans la région tamponnée suffit à garantir l'absence de collision pour la surface continue du robot, éliminant le gap entre discrétisation et géométrie réelle. Pour les intégrateurs travaillant sur la manipulation collaborative, c'est un levier direct : les approches CBF classiques requièrent une contrainte par paire de points proches, ce qui fait exploser le coût de calcul en haute dimension de configuration. En ramenant le problème à une seule fonction lisse sur tout l'environnement, le filtre devient davantage compatible avec les contraintes temps réel des contrôleurs embarqués. L'absence de métriques de latence dans la publication limite toutefois l'évaluation de la faisabilité industrielle. Les CBFs pour la sécurité robotique constituent un axe de recherche actif depuis 2019, porté notamment par les groupes d'Aaron Ames (Caltech) et des équipes au Georgia Tech. En Europe, le LAAS-CNRS à Toulouse et l'INRIA Sophia Antipolis ont contribué à des formulations similaires pour la planification sous contraintes de sécurité formelle. Du côté des intégrateurs industriels, Universal Robots, FANUC et Franka Robotics (intégré depuis dans l'écosystème Agile Robots) investissent dans des garanties de sécurité certifiables pour la co-manipulation. L'extension naturelle de ces travaux porte sur les environnements partiellement observés, données capteur bruitées ou occlusions partielles, ainsi que sur l'intégration dans une boucle de planification complète pour la manipulation dextre à grande vitesse.

UELe LAAS-CNRS (Toulouse) et l'INRIA Sophia Antipolis contribuent activement à des formulations similaires pour la planification sous contraintes de sécurité formelle, positionnant la recherche européenne comme acteur de premier plan dans ce domaine.

RecherchePaper
1 source