Recherche — page 6

426 articles · page 6 sur 9

Publications scientifiques en robotique : arXiv cs.RO, ICRA, IROS, Humanoids, CoRL — nouveaux algorithmes, benchmarks et datasets.

Humanoïdes IA physique Industriel FR/EU ecosysteme Chine/Asie Business Exosquelettes Regulation Infrastructure Societe/Ethique Autre

251arXiv cs.RO RechercheOpinion

FASTER : repenser les VLA de flux en temps réel

Des chercheurs ont publié sur arXiv (2603.19199v2) une méthode baptisée FASTER (Fast Action Sampling for ImmediaTE Reaction) visant à réduire la latence de réaction des modèles VLA (Vision-Language-Action) sur des robots physiques. Le problème ciblé est précis : dans les politiques génératives basées sur le flow matching, comme π₀.₅ de Physical Intelligence ou X-VLA, le système doit compléter l'intégralité des étapes d'échantillonnage avant de pouvoir déclencher le moindre mouvement. FASTER introduit un "Horizon-Aware Schedule" qui réorganise l'ordre de débruitage pour prioriser les actions immédiates, comprimant leur génération de dix étapes à une seule, soit une réduction d'un facteur dix. La méthode a été validée sur des robots réels, dont une tâche de tennis de table à haute dynamique, et s'exécute sur GPU grand public via une architecture client-serveur en streaming. L'apport central est analytique avant d'être technique : les auteurs formalisent le temps de réaction comme une distribution uniforme déterminée conjointement par le TTFA (Time to First Action) et l'horizon d'exécution. Cette modélisation démontre que la pratique standard d'un schedule constant dans les VLA basées sur le flow constitue un goulot d'étranglement structurel, et non un simple détail d'implémentation. En comprimant la génération des actions proches en une seule passe de débruitage tout en préservant la qualité des trajectoires longues, FASTER réduit effectivement la latence mesurée sur robot physique. Le test sur ping-pong, tâche reconnue pour son exigence en temps de boucle fermée, représente un signal de validation plus robuste que les benchmarks de manipulation statique habituellement retenus dans ce type de papier. Le contexte est celui d'une concurrence accrue entre architectures VLA depuis la publication de π₀ par Physical Intelligence fin 2024, rapidement suivie de π₀.₅, d'OpenVLA-OFT et de X-VLA. Ces modèles héritent tous du paradigme "action chunking" issu de ACT et Diffusion Policy, qui génère des segments d'actions plutôt que des commandes individuelles, introduisant mécaniquement de la latence. FASTER s'inscrit dans ce courant d'optimisation de l'inférence, aux côtés de travaux de distillation de policies, sans requérir de réentraînement du modèle de base. La démonstration sur GPU grand public est un signal d'accessibilité notable pour les intégrateurs sans infrastructure HPC, mais le stade reste celui d'une preuve de concept académique, sans déploiement industriel annoncé à ce stade.

Recherche — page 6

FASTER : repenser les VLA de flux en temps réel

R2RGEN : génération de données 3D réel-vers-réel pour une manipulation spatialement généralisée

ATLAS : un outil d'annotation pour la segmentation d'actions robotiques à long horizon

Génération 3D pour l'IA incarnée et la simulation robotique : une synthèse

HiPAN : navigation hiérarchique adaptative à la posture pour robots quadrupèdes en environnements 3D non structurés

Modélisation unifiée des actions dans un monde 4D à partir de vidéos avec débruitage asynchrone

Planificateurs de préhension 2D et 3D pour la pince asymétrique GET

DC-Ada : adaptation décentralisée des capteurs par récompense seule pour des équipes multi-robots hétérogènes

Enchevêtrement stochastique de tentacules origami déterministes pour la préhension robotique universelle

IA incarnée : une méthode multimodale intégrant la perception de profondeur pour la compréhension référentielle

Diffusion hybride pour la planification symbolique et continue simultanée

STAR-Filter : approximation convexe efficace de l'espace libre par filtrage d'ensembles étoilés en environnements bruités

Conception de processus par personas pour des environnements de travail humain-robot inclusifs pour les personnes en situation de handicap

EvolvingAgent : un agent à curriculum auto-évolutif avec modèle du monde continu pour les tâches à long horizon

IA incarnée et création artistique : Alter-Art, un robot avatar pour explorer l'art

Optimisation bi-niveaux pour la planification du mouvement et des contacts dans les robots à jambes assistés par corde

Liaisons de jambes robotiques extensibles et rétractables dynamiquement pour l'exécution de tâches multiples en recherche et sauvetage

Génération de mouvement réactif par fonctions de potentiel neuronal à phase variable

Une couche d'interaction mécanique virtuelle permet des transferts d'objets humain-robot fiables

Gouvernance par sonde atomique pour la mise à jour des compétences dans les politiques de robots compositionnels

LLM-Flax : planification robotique généralisable par approches neuro-symboliques et grands modèles de langage

Navigation sociale à long terme pour l'assistance extérieure centrée sur l'humain

Pince fluidique bistable sans source pour préhension sélective par taille et rigidité adaptative

RedVLA : l'attaque physique des modèles vision-langage-action (VLA)

Coordination par relais pour la collecte et livraison multi-robots économe en énergie

Fausse faisabilité dans le MPC à impédance variable pour la locomotion sur pattes

Relations en forme fermée et approximations d'ordre supérieur des dérivées premières et secondes de l'opérateur tangent sur SE(3)

Vulnérabilité des politiques de clonage comportemental aux attaques adversariales universelles

Preuve d'un « soi » émergent dans l'apprentissage continu d'un robot

Wiggle and Go! : identification du système pour la manipulation dynamique de corde sans démonstration

DM³-Nav : navigation sémantique décentralisée multi-agents, multimodale et multi-objets

Un cadre d'apprentissage autonome en boucle fermée piloté par LLM pour robots confrontés à des tâches inédites en environnement ouvert

LeHome : un environnement de simulation pour la manipulation d'objets déformables en contexte domestique

Modèle VLA GazeVLA : apprendre l'intention humaine pour la manipulation robotique

Remise d'objet robot-humain : étude comparative sur l'orientation et la direction d'approche adaptatives

ATRS : découpage adaptatif de trajectoires via une politique neuronale partagée pour l'optimisation parallèle

Analyse cinématique des degrés de liberté de la paume pour améliorer l'opposabilité du pouce dans les mains robotiques

OREN : réseau résiduel octree pour la cartographie en distance euclidienne signée en temps réel

LLMPhy : un raisonnement physique à paramètres identifiables combinant grands modèles de langage et moteurs physiques

Caractérisation du couplage des couples tangage-roulis dans des robots à ailes battantes de taille insecte via un cardan microfabriqué

FeudalNav : un framework simple pour la navigation visuelle

Planification efficace en temps réel pour la robotique en essaim via un tube virtuel optimal

L'araignée spatiale renaît : la Chine relance le rêve de NASA d'un robot de construction en orbite

Robot Talk, épisode 153 : des robots inspirés de l'origami, avec Chenying Liu

Démystifier la conception de l'espace d'action pour les politiques de manipulation robotique

Comment fonctionnent réellement les VLA en environnements ouverts

Simulé ou réel : robustesse des VLM au décalage de domaine en compréhension de scène robotique

Navigating l'encombrement : planification bi-niveau par points de passage pour systèmes multi-robots

Hi-WM : un modèle du monde centré sur l'humain pour l'entraînement robotique à grande échelle

Compréhension neuro-symbolique de la manipulation par chaînes d'événements sémantiques enrichies