Dossier arXiv cs.RO — page 19

2403 articles · page 19 sur 49

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

901arXiv cs.RO RecherchePaper

Manipulation aérienne : contact, couplage au milieu et géométrie de la disponibilité

Le laboratoire ne mentionne aucune entreprise ni aucun robot commercial : il s'agit d'un article de synthèse théorique (arXiv:2607.04719v1), publié comme "nouvelle soumission" et donc non encore relu par les pairs. Sa thèse centrale : la manipulation aérienne, c'est-à-dire les robots volants qui touchent, saisissent ou déplacent des objets, ne peut pas être traitée comme de la manipulation classique simplement montée sur un drone. Un bras robotique au sol repose sur une base fixe et découplée de la tâche ; un robot volant, lui, ne reste en l'air que par un échange continu de quantité de mouvement et d'énergie avec l'air ambiant, ce qui lie intrinsèquement le maintien en vol, le déplacement, la stabilisation et l'interaction avec l'environnement. Les auteurs proposent un cadre "conscient du milieu" distinguant trois modes d'interaction : par contact, par le fluide environnant, ou les deux combinés. Ils classent des exemples biologiques (oiseaux, insectes) et robotiques existants selon une échelle de capacités, puis développent une lecture géométrique de l'actionnement où la redondance cinématique crée des mouvements internes sans effet sur la tâche visible, mais utilisables pour préparer de l'énergie, améliorer la réactivité aérodynamique ou exploiter un couplage passif avec l'air. L'enjeu dépasse la théorie pure : les drones manipulateurs conçus pour l'inspection, l'agriculture ou la logistique héritent en général de l'architecture de contrôle des bras robotiques terrestres, avec une boucle de stabilisation de vol traitée séparément de la tâche de manipulation. Cette synthèse suggère que ce découpage est structurellement limité, puisque l'air n'est pas un support neutre : il réagit à l'action du robot, et ignorer ce retour produit des systèmes moins efficaces. Cela recadre une partie de l'écart souvent constaté entre démonstrations et produits viables dans ce domaine : le problème ne serait pas seulement lié à l'actionneur ou à la perception, mais à une base théorique incomplète sur ce qu'est réellement la "base" d'un robot lorsqu'elle vole. C'est un appel aux équipes de recherche et aux intégrateurs à concevoir conjointement vol et interaction plutôt que d'empiler un bras sur un drone stabilisé indépendamment. Le texte s'inscrit dans une littérature en croissance depuis le début des années 2010, quand les premiers travaux ont couplé drones et bras rigides, suivis d'approches par système tenu, magnétique ou par succion, en parallèle d'études bio-inspirées sur les oiseaux et insectes combinant posé, préhension et modulation de poussée. Aucun acteur français ou européen n'est cité dans le résumé. Il s'agit d'une contribution conceptuelle destinée à guider la conception de futures plateformes, sans validation expérimentale ni implémentation concrète présentées à ce stade ; ces suites restent à venir dans des travaux ultérieurs.

Dossier arXiv cs.RO — page 19

Manipulation aérienne : contact, couplage au milieu et géométrie de la disponibilité

Cortex : un cadre d'agent incarné à alignement bidirectionnel pour la manipulation à long horizon

Ask-to-Clarify : résoudre l'ambiguïté des instructions par un dialogue multi-tours

Worldscape-MoE : un modèle du monde à mélange d'experts unifié pour un contrôle d'action hétérogène et évolutif

Caméras fixes ou libres : un modèle vision-langage-action sans calibration, robuste aux changements de vue

BIEVR-LIO : odométrie LiDAR-inertielle robuste via des cartes de voxels enrichies par images de relief

Politique de latence latente : apprendre des politiques visuomotrices robustes en restant dans la distribution

CoFL-S : champs de flux sectoriels interrogeables spatialement pour la navigation locale conditionnée par le langage

Robot rocker-bogie reconfigurable pour franchir des marches hautes et virer

L'œil mobile : améliore la généralisation spatiale des VLA grâce à une collecte de données hybride et dynamique

Apprendre à bouger avant d'agir : pré-entraînement générique pour les VLA

L'imagination du toucher : manipulation guidée par le toucher via des représentations tactiles imaginées

HEFT : téléopération d'humanoïde grandeur nature à charge lourde, guidage privilégié et curriculum par fenêtres

Chemin de planification dans des modèles du monde physiquement viables

Titre découverte conjointe de symboles d'objets et d'actions par prédiction d'effets pour la planification de manipulation robotique

Robots demandent leur chemin : la navigation sociale à base de communication

Compositional : apprentissage de la manipulation fonctionnelle dextérique sans démonstrations

ViTL : navigation en langage naturel zéro-shot guidée par logique temporelle via modèles vision-langage

« RoboTacDex : un jeu de données visuo-tactile-action dextérique pour la manipulation humanoïde »

Prompting d'équipes de robots en langage naturel

Transfert simulation-réel efficace de modèles monde-action à partir de données synthétiques

TAPE : trajectoires conscientes du câble pour l'exploration autonome de cavités 3D inconnues, drone anti-enchevêtrement

Multi-apprentissage continu : adapter des politiques visuomotrices préentraînées à la force

WoVR : des modèles du monde comme simulateurs fiables pour l'entraînement post-déploiement des politiques VLA par renforcement

Fiez-vous à vos instincts : RL à l'inférence guidé par la confiance pour les modèles VLA

Autonomie partagée intelligible : communication implicite des croyances du robot par le mouvement

CORE : régularités communes issues de démonstrations visuelles sans actions pour la manipulation robotique

Mémoire analytique centrée sur les concepts pour la manipulation incarnée à base d'agents

StereoVLA : améliorer les modèles vision-langage-action grâce à la vision stéréoscopique

PhysisForcing : simulateur du monde renforcé par la physique pour la manipulation robotique

CacheMPC : commande prédictive par modèle certifiée avec cache pour la locomotion quadrupède

RelAfford6D : graphes d'affordance 6D relationnels pour la manipulation robotique guidée par contraintes

MPC-Injection : orienter le RL de locomotion hors-politique vers les bassins d'attraction du contrôleur

RouterVLA : des tests de fumée transformés en supervision pour la sélection de modèles VLA hétérogènes

Pilotage du comportement robotique à l'inférence par reconfiguration physiquement informée de la structure de tâche

Les modèles d'action du monde permettent un apprentissage par imitation continu avec rejeu génératif récurrent

SSI-Policy : apprentissage d'interfaces de scène structurées pour la manipulation robotique vision-langage

Tactile-WAM : modèle d'action du monde sensible au toucher avec attention asymétrique tactile

E-TTS : un nouveau cadre de mise à l'échelle au moment de l'inférence pour la manipulation robotique

ROAD-VLA : adaptation en ligne robuste par auto-distillation pour les modèles vision-langage-action

WOLF-VLA : framework de locomotion optimale corps entier pour humanoïdes avec apprentissage vision-langage-action

TacVerse : un jeu de données et benchmark multi-capteurs pour la perception tactile visuelle entre capteurs

Découplage de la sémantique et de l'ancrage géométrique : prompts visuels spatiaux pour l'apprentissage par imitation guidé par le langage

RoboRouter : sélection de politiques sans entraînement pour la manipulation robotique

FORCE : affinage par renforcement efficace de modèles VLA via préchauffage calibré par valeur et auto-distillation

Récupération mémorielle dans les politiques visuomotrices pour le contrôle robotique à long horizon

TIDAL : boucle diffusion-action à entrelacement temporel pour le contrôle VLA haute fréquence

ReST-MCTS centré sur la récompense : un cadre robuste de prise de décision pour la manipulation robotique en environnement incertain

OmniVLA-RL : modèle vision-langage-action avec compréhension spatiale et apprentissage par renforcement en ligne

Préentraînement séparé des dynamiques directe et inverse pour un apprentissage robotique découplé