Dossier arXiv cs.RO — page 16

2263 articles · page 16 sur 46

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

751arXiv cs.RO RecherchePaper

Passage de messages amélioré par flots normalisants pour la localisation collaborative multi-robots

Des chercheurs proposent dans un preprint arXiv (identifiant 2606.29868, juin 2026) un algorithme de passage de messages pour la localisation collaborative distribuée de flottes multi-robots, en unifiant la propagation de croyances gaussiennes (GBP) et l'approximation champ moyen (MF). GBP préserve les dépendances entre les états des robots, tandis que MF estime dynamiquement les statistiques de bruit. Pour traiter les termes non conjugués issus de modèles de mesure non linéaires, l'algorithme intègre un estimateur de gradient basé sur des flux normalisants (NF), des modèles génératifs qui rendent l'échantillonnage paramétrique et entraînable de bout en bout, les paramètres du NF étant ajustés selon le comportement du passage de messages lors d'un entraînement global. La méthode est étendue aux espaces d'états sur groupes de Lie pour représenter correctement les rotations 3D, puis validée sur des véhicules de surface autonomes (ASV) en fusionnant odométrie, mesures GNSS et télémétrie inter-robots ultra-wideband (UWB). La nature distribuée de l'algorithme élimine tout point de défaillance centralisé : chaque robot maintient et propage ses propres estimations, ce qui est critique pour des flottes opérant en environnements dégradés ou à couverture GNSS partielle. L'intégration des flux normalisants comme estimateurs de gradient rend l'approximation adaptative, là où la linéarisation classique (EKF) perd en précision face à des non-linéarités fortes. La fusion odométrie/GNSS/UWB couvre explicitement les situations où le signal satellite seul est insuffisant, configuration typique en milieu maritime, portuaire ou en zone urbaine dense. La localisation collaborative multi-robots est un domaine actif depuis les années 2000, avec des approches allant des filtres particulaires décentralisés aux graphes de facteurs incarnés par des systèmes comme COVINS ou Kimera-Multi. L'apport des flux normalisants au cadre de passage de messages reste récent, et la validation expérimentale sur ASVs en simulation et en conditions réelles distingue ce travail des contributions purement théoriques. Les auteurs n'annoncent pas de déploiement opérationnel : l'étape suivante probable est la montée en échelle vers des flottes plus larges et l'intégration dans des pipelines de navigation pour l'inspection maritime ou la logistique portuaire autonome.

Dossier arXiv cs.RO — page 16

Passage de messages amélioré par flots normalisants pour la localisation collaborative multi-robots

Modèles vision-langage pour la navigation de robots sociaux déployables : relier le raisonnement sémantique et le contrôle de bas niveau

WoVR : des modèles du monde comme simulateurs fiables pour l'entraînement post-déploiement des politiques VLA par renforcement

Mémoire analytique centrée sur les concepts pour la manipulation incarnée à base d'agents

CORE : régularités communes issues de démonstrations visuelles sans actions pour la manipulation robotique

Limites de stabilité et performance motrice dans les interactions dyadiques médiées par robot avec délai

KYON : quadrupède semi-modulaire roues-pattes aux capacités bimanuelles agiles

CSAR : architecture système conteneurisée pour la robotique

PA-BiCoop : un cadre coopératif principal-auxiliaire pour la manipulation bimanuelle généraliste

Apprentissage résiduel multi-échelle et adaptation en ligne pour manipulateurs aériens

Apprendre à lancer : livraison agile et précise de charge utile suspendue par câble avec un quadrirotor

DexCompose : réutiliser des politiques dextériques pour la manipulation multi-tâche avec une seule main

DIM-WAM : modélisation monde-action avec mémoire d'événements historiques diversifiés

PhysisForcing : simulateur du monde renforcé par la physique pour la manipulation robotique

StereoVLA : améliorer les modèles vision-langage-action grâce à la vision stéréoscopique

Affinage par renforcement des politiques de flux pour les modèles vision-langage-action (VLA)

RelAfford6D : graphes d'affordance 6D relationnels pour la manipulation robotique guidée par contraintes

PhysReflect-VLA : faisabilité physique et régulation auto-réflexive pour des modèles VLA fiables

RouterVLA : des tests de fumée transformés en supervision pour la sélection de modèles VLA hétérogènes

ReaDy-Go : simulation dynamique réel-vers-sim par Gaussian Splatting 3D pour la navigation visuelle avec obstacles mobiles

TIDAL : boucle diffusion-action à entrelacement temporel pour le contrôle VLA haute fréquence

ARTOO-DARTU : étude de la collaboration humain-robot en réalité augmentée avec atténuation des occlusions pour les tâches d'entrepôt

PhyGile : génération de mouvements guidée par préfixe physique pour le suivi agile d'humanoïdes généralistes

Cadre de détection et reconnaissance des interactions humain-humain pour robots mobiles de service

MinInter : minimiser l'interpolation de trajectoire lors de l'augmentation de données pour l'apprentissage par imitation

CoMo : apprendre le mouvement latent continu depuis des vidéos internet pour un apprentissage robotique à grande échelle

Fail-RAG : un cadre fondé sur la RAG pour l'identification des défaillances des robots

Génération d'actions robotiques continues et cohérentes par correspondance de flux sensible aux fréquences

VFILC : extrapolations de fréquence précises en apprentissage par imitation via ILC à fréquence d'échantillonnage

One-to-Two Acting : un cadre pour étendre les actions d'un agent mono-bras à deux bras

VOiLA : planification en ligne vectorisée avec modèle de diffusion pour agents POMDP

Une démonstration vaut mille trajectoires : augmentation vue-action pour les politiques visuomotrices

Coordination par dépliage profond

Apporte ma tasse ! Personnalisation des modèles vision-langage-action par prompting visuel attentionnel

Étude comparative sur l'agilité, l'efficacité et l'absorption des chocs des robots bipèdes à orteils actifs

R2BC : apprentissage par imitation multi-agents à partir de démonstrations d'un agent unique

Récupérer, Découvrir, Planifier : apprendre des compétences et des concepts à partir des échecs des robots

PAIWorld : un modèle fondation du monde en 3D cohérent pour la manipulation robotique

GASE : système automatisé basé sur le Gaussian Splatting pour la reconstruction d'environnements de simulation incarnée

WireCraft : un benchmark de simulation pour la manipulation industrielle de câbles flexibles

Quand les robots dorment : consolidation hors ligne des compétences pour l'apprentissage à politique partagée

OmniRetarget : génération de données préservant les interactions pour la loco-manipulation corps entier des humanoïdes

DexLink Hand : une main compacte et abordable à 16 degrés de liberté dotée d'une dextérité humaine

Un cadre d'optimisation hybride pour la synthèse de saisie sous observations partielles

Adaptation aux dommages en quelques secondes pour les matériaux architecturés

Surveillance respiratoire sans contact sur robots mobiles hétérogènes : un cadre multimodal de calcul embarqué

WeaveLA : mémoire latente inter-sous-tâches pilotée par événements pour la manipulation robotique répétitive

Robots collaborants : imitation séquentielle asymétrique pour l'apprentissage de politiques couplées

Identification d'un modèle de consommation électrique basé sur la physique pour le bras humanoïde Unitree G1

Apprentissage de la manipulation dextérique à partir de vidéos monoculaires de mains humaines