Recherche — page 8

426 articles · page 8 sur 9

Publications scientifiques en robotique : arXiv cs.RO, ICRA, IROS, Humanoids, CoRL — nouveaux algorithmes, benchmarks et datasets.

Humanoïdes IA physique Industriel FR/EU ecosysteme Chine/Asie Business Exosquelettes Regulation Infrastructure Societe/Ethique Autre

351arXiv cs.RO RechercheOpinion

Alignement de sécurité des modèles VLA par apprentissage contraint : le projet SafeVLA

Des chercheurs, vraisemblablement affiliés à l'Université de Pékin (l'URL du projet pointe vers pku-safevla.github.io), ont publié en mars 2025 SafeVLA, une méthode d'alignement sécurisé pour les modèles vision-langage-action (VLA) déployés sur robots physiques. L'approche, baptisée ISA (Integrated Safety Approach), repose sur le paradigme des processus de décision de Markov contraints (CMDP) et combine trois étapes : modélisation formelle des exigences de sécurité, élicitation active de comportements dangereux, puis optimisation min-max de la politique robot via du renforcement contraint. Sur des tâches de manipulation mobile à long horizon, SafeVLA réduit le coût cumulé des violations de sécurité de 83,58 % par rapport à la méthode de référence state-of-the-art, tout en améliorant simultanément le taux de succès des tâches de 3,85 points. Les données, modèles et benchmark associés sont publiés en open source. Ce résultat est notable parce qu'il adresse directement le principal frein à la commercialisation des VLA en environnement industriel : la garantie de comportement sûr hors distribution. Jusqu'ici, les politiques générales de type pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) montraient des performances impressionnantes en laboratoire mais offraient peu de garanties formelles sur les scénarios de défaillance extrêmes, les cas limites ou les perturbations inattendues. SafeVLA propose un cadre d'assurance quantifiable, avec une généralisation démontrée aux perturbations out-of-distribution, ce qui intéresse directement les intégrateurs industriels et les COO qui exigent des SLA de sécurité avant tout déploiement en cellule humaine ou en espace partagé. L'amélioration simultanée du taux de succès contredit l'hypothèse courante selon laquelle la sécurité contrainte dégrade nécessairement la performance. Les VLA ont connu une accélération significative depuis 2023 avec des travaux fondateurs comme RT-2 (Google DeepMind) et OpenVLA, mais la question de leur alignement sécurisé pour une utilisation réelle restait largement ouverte, la plupart des équipes se concentrant sur les capacités génératives plutôt que sur les garanties de comportement. SafeVLA s'inscrit dans un mouvement plus large de formalisation de la sécurité robotique, en parallèle des travaux de Physical Intelligence sur pi-0, de 1X Technologies ou de Figure AI avec Figure 03. Aucun partenaire industriel ni calendrier de déploiement n'est mentionné dans la publication : il s'agit d'une contribution académique avec benchmark public, pas d'un produit shipé. Les prochaines étapes naturelles seraient l'intégration de cette approche dans des architectures VLA commerciales et sa validation sur des plateformes humanoïdes à grande échelle.

UELes résultats de SafeVLA pourraient alimenter les travaux de normalisation de la sécurité des VLA en Europe (AI Act, certification robots collaboratifs), mais aucun acteur européen n'est impliqué directement dans cette publication académique.

Recherche — page 8

Alignement de sécurité des modèles VLA par apprentissage contraint : le projet SafeVLA

ReconVLA : un cadre VLA guidé par l'incertitude et la détection des défaillances pour le contrôle robotique

MM-Hand : une main robotique dextère modulaire à 21 degrés de liberté avec actuation déportée

Auto-reconnaissance sensorimotrice dans les robots pilotés par des LLM multimodaux

LongBench : évaluation des politiques de manipulation robotique sur des tâches réelles à horizon long

InternScenes : un jeu de données de scènes intérieures simulables à grande échelle avec des agencements réalistes

ICAT : tests adaptatifs fondés sur des incidents réels pour la prédiction de risques physiques dans les modèles du monde incarnés

EgoWalk : un jeu de données multimodal pour la navigation robotique en conditions réelles

Assemblage robotique à contacts multiples dans la construction par politique de diffusion

Préentraînement séparé des dynamiques directe et inverse pour un apprentissage robotique découplé

Apprentissage rapide par simulation GPU pour la manipulation de matériaux déformables en quelques minutes

XEmbodied : un modèle fondation aux indices géométriques et physiques renforcés pour les environnements incarnés à grande échelle

Rule-VLN : unifier perception et respect des règles par raisonnement sémantique et rectification géométrique

2D ou 3D : qui gouverne la saillance dans les modèles VLA ? Un cadre d'élagage de tokens en trois étapes avec conscience de la saillance modale

Nouveaux algorithmes pour la construction de variétés de contact régulièrement différentiables et vectorisables

EmbodiedLGR : un graphe léger pour la mémoire sémantique-spatiale des agents robotiques

AnchorRefine : manipulation synergique par ancrage de trajectoire et raffinement résiduel pour les modèles VLA

LatentMimic: Terrain-Adaptive Locomotion via Latent Space Imitation

Rewind-IL : détection des échecs en temps réel et réinitialisation d'état pour l'apprentissage par imitation

UniDomain : préentraînement d'un domaine PDDL unifié à partir de démonstrations réelles pour la planification robotique généralisable

Atelier interdisciplinaire sur l'intelligence mécanique : rapport de synthèse

Amélioration de la reconstruction de surfaces en verre par estimation de profondeur pour la navigation robotique

Raffinement de démonstrations accélérées par contrôle itératif incrémental pour l'apprentissage par imitation à contact riche

Navigation en foule par LiDAR avec représentation des groupes en bordure de champ de vision

Détection structurelle en temps réel pour la navigation intérieure par LiDAR 3D avec images en vue aérienne

DART : commande prédictive augmentée par apprentissage pour la manipulation bi-bras non préhensile

Actionneurs magnétiques bio-inspirés capables de pousser, tirer, ramper et saisir

Actionnement par multiplexage temporel dans les bras à tendons : conception légère et tolérance aux pannes

COFFAIL : un jeu de données sur les succès et anomalies d'exécution de compétences robotiques pour la préparation du café

Système de vision par projection de franges pour le démontage autonome de disques durs

Contrôle en régime périodique permanent de la rotation d'un mouchoir par un poignet anti-parallélogramme à tendons

Les gens apprécient-ils un entraîneur robot ? Étude de cas avec Snoopie le Pacerbot

Géwu : un environnement interactif en ligne pour l'apprentissage par renforcement en robotique

Visual-RRT : planification de chemins vers des objectifs visuels par rendu différentiable

Discussion sur la prédiction de trajectoires conditionnelles

HAVEN : navigation hiérarchique sensible aux adversaires, visibilité et couverts par réseaux Q à transformeurs profonds

DAG-STL : un cadre hiérarchique pour la planification de trajectoires zéro-shot sous contraintes de logique temporelle signalée

Un cadre de recherche guidé par l'accessibilité de Hamilton-Jacobi pour la navigation intérieure planaire sûre et efficace des robots

Commande optimale de robots planaires sous-actionnés différentiellement plats pour la réduction des oscillations

Planification de trajectoire STL et analyse des risques pour la collaboration humain-robot avec un drone multi-rotors

GaLa : des modèles vision-langage guidés par hypergraphe pour la planification procédurale

Modèles de diffusion séquentiels pour l'apprentissage méta en contexte de la dynamique des robots

Arrêt d'urgence pour robots manipulant des liquides

Optimisation par diffusion pour accélérer la convergence des problèmes à temps minimal sur bras doubles redondants

Learning-Based Sparsification of Dynamic Graphs in Robotic Exploration Algorithms

De la cinématique à la dynamique : apprendre à affiner des plans hybrides pour une exécution physiquement faisable

Locomotion d'un robot serpent élastique par dynamique naturelle

Greedy Kalman-Swarm : amélioration de l'estimation d'état dans les essaims de robots en environnements difficiles

Modélisation du contact améliorée pour lier extéroception et proprioception dans les robots à croissance progressive

IA incarnée multi-agents : allocation de puissance centrée sur la mémoire pour la réponse aux questions