Dossier arXiv cs.RO — page 29

2642 articles · page 29 sur 53

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

1401arXiv cs.RO RecherchePaper

Interventional Causal Circuits pour des Tests d'Action Robotique Sûrs et une Récupération d'Échec

L'action robotique nécessite d'être non seulement probablement réussie, mais explicitement validée comme sûre avant exécution. C'est le point de départ d'un nouveau papier arXiv (2607.14826v1) qui s'attaque à un problème concret : tester formellement les paramètres de mouvement d'un robot coûte cher en calcul, et ce coût explose avec la dimensionnalité de l'espace d'action. Quand une action proposée est rejetée par le testeur, la réponse naïve consiste à rééchantillonner à l'aveugle jusqu'à trouver un candidat valide, une méthode jugée coûteuse et sans garantie de convergence. Les auteurs proposent à la place un diagnostic causal : identifier précisément quel paramètre a provoqué l'échec et quelle valeur corrective maximise la probabilité de réussite sous la distribution interventionnelle. Le système couple un Joint Probability Tree (JPT) à un Causal Circuit dérivé d'un Marginal-Deterministic Variable Tree, permettant un calcul exact en temps polynomial, sans réentraînement ni collecte de données supplémentaire. Testé en simulation ROS2, le framework réduit les tentatives échouées de 10,3% avec un JPT de bonne qualité, et jusqu'à 37% avec un JPT dégradé. Pour les intégrateurs et responsables robotique, l'intérêt dépasse le simple gain de performance : chaque plan rejeté génère un rapport structuré et interprétable, nommant la variable causale principale, sa valeur observée et la région corrective recommandée. Cela permet une supervision humaine claire tout en autorisant une récupération autonome, sans modèle d'échec entraîné séparément, un point sensible pour les architectures VLA et les pipelines de contrôle où la traçabilité des décisions devient un prérequis réglementaire autant que technique. La robustesse accrue face à un JPT dégradé (donc à des données d'apprentissage imparfaites) est particulièrement pertinente pour des déploiements réels où les modèles probabilistes ne sont jamais parfaits. Ce travail s'inscrit dans la lignée des recherches sur les tests de sécurité formels en robotique et l'inférence causale appliquée au contrôle, un domaine où la littérature reste encore majoritairement académique. Classé comme nouvelle publication, le papier ne rapporte pour l'instant que des résultats en simulation ROS2 ; l'étape suivante attendue serait une validation sur du matériel réel, condition nécessaire avant toute adoption industrielle de ce type de diagnostic causal embarqué.

Dossier arXiv cs.RO — page 29

Interventional Causal Circuits pour des Tests d'Action Robotique Sûrs et une Récupération d'Échec

Robots humanoïdes et interaction homme-robot dans les architectures d'IA générative via l'Agent-Client Protocol

Anticipation sémantique pour les représentations d'actions robotiques

Kepler-Encoder-v0.1 : vers un modèle d'embedding multimodal pour robots

Fusion des modalités tactiles pour les modèles vision-langage-action (VLA)

Vers des objectifs de navigation par le langage : une approche vision-langage pour la navigation sémantique de robots mobiles par perception RGB-D

ABot-AgentOS : un système d'exploitation robotique généraliste doté d'une mémoire multimodale à long terme

UR-VC : correction non supervisée de la valeur robotique pour proxys de progression dérivés du temps

Infra-Swarm : essaimage multi-robots robuste basé sur la vision, via spectre proche infrarouge

EFLUX : navigation adaptative de formation multi-robots élastique pilotée par des LLM à base d'agents

Diffusion pour la planification de trajectoires multi-robots à long horizon dans des environnements partagés avec des humains

Robotique semi-corporelle : liaison sémantique-actionnement d'un mouvement de trompe souple inspiré de l'éléphant via flow matching léger

Extrapolation des paramètres de tâche par apprentissage des tâches inverses à partir de démonstrations directes

Vers une téléopération dextre au niveau humain

SUREFlow : appariement de flux résiduel adapté à l'incertitude dans l'espace d'états pour une manipulation robotique robuste

IA incarnée en chimiste quantique : Qumus automatise la recherche sur les matériaux quantiques

Nori Bot : un manipulateur mobile sol-comptoir à moins de 1 000 dollars

DexJoCo : un benchmark et une boîte à outils pour la manipulation dextérique orientée tâche sur MuJoCo

BiPneu : conception et contrôle d'un système pneumatique à pression bipolaire pour robots souples

Diffusion coordonnée : générer des comportements multi-agents sans démonstrations multi-agents

ECHO : mémoire hiérarchique continue pour les modèles vision-langage-action (VLA)

ACSAC : acteur-critique à taille de segment adaptative avec réseau-Q à Transformer causal

Kairos : un système de déploiement extensible pour l'IA physique

Piloter un robot humanoïde par instructions en langage libre : un modèle d'action à grand vocabulaire de mouvement unifié

RePO-VLA : l'optimisation de politique guidée par la récupération pour les modèles vision-langage-action (VLA)

Apprentissage de compétences d'attaquant agile pour robots humanoïdes footballeurs à partir de capteurs bruités

ElasticFlow : une politique à horizon temporel élastique pour la manipulation guidée par le langage

AT-VLA : injection tactile adaptative pour une meilleure réactivité dans les modèles vision-langage-action

Évaluation d'une colonne vertébrale actionnée pour la locomotion agile de quadrupèdes

Estimation de pose 6D par régression de cartes de chaleur de points-clés avec réseaux de neurones résiduels RGB-D

TriRelVLA : structure relationnelle triadique pour la manipulation incarnée généralisable

EA-WM : un modèle du monde génératif intégrant des champs d'action cinématique-visuel structurés

DexSim2Real : transfert simulation-réel guidé par un modèle fondation pour la manipulation dextérique généralisable

GA3T : jeu de données de traversabilité pour équipes de robots sol-aériens hétérogènes en milieux non structurés

Apprendre à piloter en quelques minutes : Infoprop Dyna sur le Mini Wheelbot

Apprentissage robotique à partir de vidéos humaines : une synthèse

MotuBrain : un modèle du monde avancé pour le contrôle robotique

RopeDreamer : modèle d'espace d'état récurrent cinématique pour la dynamique des objets linéaires déformables

ATLAS : un outil d'annotation pour la segmentation d'actions robotiques à long horizon

Modélisation unifiée des actions dans un monde 4D à partir de vidéos avec débruitage asynchrone

dWorldEval : évaluation évolutive de politiques robotiques via un modèle du monde à diffusion discrète

Apprendre l'apesanteur : imiter des mouvements non auto-stabilisants sur un robot humanoïde

État de l'art de la robotique à pattes en environnements non inertiels : passé, présent et futur

UniT : vers un langage physique unifié pour l'apprentissage de politiques humain-humanoïde et la modélisation du monde

Mémoire plutôt que cartes : localisation d'objets 3D sans reconstruction

Navigation en foule par LiDAR avec représentation des groupes en bordure de champ de vision

Détection structurelle en temps réel pour la navigation intérieure par LiDAR 3D avec images en vue aérienne

Nouveaux algorithmes pour la construction de variétés de contact régulièrement différentiables et vectorisables

LatentMimic: Terrain-Adaptive Locomotion via Latent Space Imitation

Les limites de l'évolution lamarckienne face à la pression de nouveauté morphologique