Recherche — page 4

2549 articles · page 4 sur 51

Publications scientifiques en robotique : arXiv cs.RO, ICRA, IROS, Humanoids, CoRL — nouveaux algorithmes, benchmarks et datasets.

Humanoïdes IA physique Industriel FR/EU ecosysteme Chine/Asie Business Exosquelettes Regulation Infrastructure Societe/Ethique Autre

151arXiv cs.RO RecherchePaper

Robot quadrupède : apprentissage par renforcement de bout en bout pour monter et descendre des escaliers en intervention incendie intérieure

Des chercheurs ont développé une approche d'apprentissage par renforcement profond en deux étapes pour entraîner des robots quadrupèdes Unitree Go2 à monter et descendre des escaliers de manière autonome, dans le cadre de recherches en intérieur lors d'incendies. L'étude, publiée sur arXiv (2602.03087v2, version révisée), s'appuie entièrement sur le moteur de simulation Isaac Lab de NVIDIA. Dans une première phase, les robots sont entraînés sur un terrain abstrait en forme de pyramide d'escaliers. Dans une seconde phase, la politique apprise est transférée vers des configurations d'escaliers réalistes et variées, droits, en L et en spirale, représentatives des bâtiments réels. Le système repose sur une perception locale par carte de hauteur et une formulation de navigation basée sur une ligne centrale, qui unifie l'apprentissage de la navigation et de la locomotion sans recourir à une planification hiérarchique séparée. L'enjeu pratique est direct: lors d'une recherche primaire en intérieur après un départ de feu, un robot doit balayer rapidement des zones dangereuses, repérer des victimes potentielles et surveiller des matériaux inflammables, souvent en empruntant des cages d'escalier de formes différentes selon les bâtiments. La difficulté classique pour les quadrupèdes n'est pas seulement de gravir des marches, mais de généraliser ce savoir-faire à des topologies d'escaliers jamais vues, sans replanification lourde à chaque changement de géométrie. En démontrant qu'une politique unique, entraînée d'abord sur un terrain simplifié puis affinée sur des cas réalistes, généralise à des formes variées à partir de perception locale seulement, les auteurs apportent un élément de preuve en faveur des architectures de bout en bout face aux pipelines de navigation classiques, plus modulaires mais plus coûteux à adapter. Le travail reste cependant limité à la simulation: aucun transfert vers un robot physique n'est rapporté dans cette version, ce qui laisse ouverte la question du sim-to-real. Le Go2 d'Unitree, plateforme quadrupède abordable largement utilisée dans la recherche académique, sert ici de base matérielle de référence, dans un secteur où Boston Dynamics (Spot) et ANYbotics occupent le segment industriel haut de gamme. Isaac Lab, environnement de simulation robotique de NVIDIA basé sur Isaac Sim, s'impose comme plateforme standard pour ce type d'entraînement RL à grande échelle. Les auteurs présentent aussi une analyse empirique des taux de réussite, de l'efficacité et des modes d'échec à mesure que la difficulté des escaliers augmente, un exercice de transparence utile pour situer les limites actuelles de la méthode avant d'envisager des essais sur robot réel.

Recherche — page 4

Robot quadrupède : apprentissage par renforcement de bout en bout pour monter et descendre des escaliers en intervention incendie intérieure

Vol, suivi, atterrissage : localisation magnétique sans infrastructure pour équipes hétérogènes UAV-UGV

L'Open Ant, une plateforme robotique pour la recherche en apprentissage par renforcement

Koopman DCM : les fonctions propres instables comme représentations pour l'équilibre des robots à pattes

CONTACT : apprentissage tactile sensible au contact pour le démontage robotique

RoboInter1.5 : une suite de représentations intermédiaires holistiques pour la modélisation du monde incarné et la manipulation robotique

Vers un apprentissage par renforcement piloté par couple pour la locomotion quadrupède

Robot humanoïde : synthèse d'arbres de comportement corrects par construction à partir de spécifications en logique temporelle de signaux

Odométrie proprioceptive à modèles multiples interactifs pour robots à pattes

TacRefineNet : affinage de la préhension tactile guidé par objectif pour objets à arêtes saillantes

Alignement de cap par vision seule avec seuil de confiance pour systèmes coopératifs UAV-UGV

Real2Sim à base d'agents : modélisation physique du monde par agents vision-langage

Modèles du monde à embodiment croisé : passage à l'échelle pour la manipulation dextérique

Robot musculaire pneumatique en tissu basé sur le principe du lacet

Design et analyse de stabilité d'une main sous-actionnée à doigts en rotation passive

Robot DASH : conception minimaliste et locomotion aérienne-terrestre optimale via contrôle sous contraintes de contact

FARO : optimisation de mouvement de robot sensible à la faisabilité

Modélisation unifiée du monde par actions visuelles masquées

TransDex : pré-entraînement d'une politique visuo-tactile par reconstruction de nuage de points pour la manipulation dextérique d'objets transparents

STeP : logique temporelle de signaux pour des spécifications précises de génération d'actions avec des modèles vision-langage

Mise en évidence de la découverte de mouvements primitifs chez un robot humanoïde via des cartes auto-organisatrices pour la reconnaissance de phase

Calibrage extrinsèque en deux étapes d'un lidar à balayage linéaire statique avec plateforme rotative

Uncertitude et allocation de tâches multi-robots avec récompenses inter-robots fortement couplées

Planification stochastique kinodynamique multi-objectifs contre des adversaires

IA de bout en bout par diffusion visuo-force avec apprentissage structurel lent-rapide : ImplicitRDP

WorldScape Policy 2.0 : vers une modélisation d'action du monde pilotable grâce à une mémoire enrichie par le raisonnement

Le décomposition en torseurs des robots sériels pour les tâches à mobilité réduite

Frottement clé pour améliorer les modèles du monde des robots

RobustVLA : robustesse d'un modèle vision-langage-action face aux perturbations multimodales

RoboHarness : orchestration mémoire de politiques robotiques hétérogènes pour la planification à long terme

Reasoning à double tranchant : architecture et robustesse inter-étapes des modèles vision-langage-action

Musée : étude sur l'acceptation du robot Android Andrea, avec et sans simulation d'émotions

Fermeture de la boucle en VLA humanoïde : jetons d'objets 3D persistants pour une loco-manipulation vérifiable

Robots à double bras : des gains de performance en assemblage de précision

Persistance des connaissances spatio-temporelles : un graphe pour la mémoire de scène des robots dans les questions-réponses

MEVION : système de collecte de données open source à faible coût pour la manipulation à deux bras rapide et puissante

Distillation de priorités globales de traversabilité pour la prédiction d'affordance basée sur l'image en environnement tout-terrain

Stabilité et confort dans les interactions entre robots mobiles et piétons

Modèles du monde JEPA à régularisation de profondeur : des représentations plus transférables à partir de données robotiques réelles en extérieur

Robot réceptionniste à tête humanoïde articulée pour interaction humaine naturelle

La saisie robotique facilitée par xperception

GraspADMM : améliorer la synthèse de prises dextériques par optimisation ADMM

Robuste aux perturbations : contrôle cinématique sécurisé pour robots à architecture fermée

L'apprentissage par imitation en contexte avec raisonnement visuel

Manifold-Guided pour assemblages serrés

IA incarnée : locomotion des quadrupèdes par apprentissage par renforcement (sim-vers-réel dans Isaac Sim)

De la perception à l'assistance : autonomie partagée à vocabulaire ouvert pour la manipulation robotique

SplatSearch : navigation vers une image cible pour robots mobiles via 3D Gaussian Splatting et modèles de diffusion

Robots quadrupèdes : transport coopératif par NMPC distribué et critique de sécurité basé sur ADMM

Robotique forestière : optimisation stochastique de trajectoire sous contraintes pour une grue forestière optimale en temps