Dossier arXiv cs.RO — page 14

2263 articles · page 14 sur 46

Les preprints robotique sur arXiv cs.RO : les avancées techniques avant publication, dont planification, learning from demos, sim2real, manipulation.

651Interesting Engineering HumanoïdesOpinion

Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée

Astribot, startup robotique de Shenzhen également connue sous le nom Stardust Intelligence, a ouvert les commandes de son humanoïde T1 à partir de 13 000 dollars, soit environ sept fois moins cher que son propre modèle phare S1 vendu près de 100 000 dollars. Le T1 est un humanoïde à base roulante de 155 cm pour 66 kg, doté de 23 degrés de liberté hors effecteurs, avec une capacité de charge de 5 kg par bras. Son architecture motrice repose sur des câbles tendus, la même approche que le S1, conçue pour produire des mouvements plus fluides qu'un entraînement par engrenages traditionnels. Il accepte des pinces robotiques standard et des mains à cinq doigts pour la manipulation fine, et cible des applications comme la cuisine, les opérations en laboratoire, le pliage du linge, le tri de pièces automobiles et la recharge de véhicules électriques. L'IA embarquée est entraînée principalement par démonstration humaine plutôt que par téléopération, une méthode d'imitation learning qui permet au robot d'apprendre des workflows en observant un opérateur humain. Le seuil des 13 000 dollars modifie le calcul économique pour les intégrateurs et les équipes qui souhaitent piloter l'humanoïde en environnement industriel. À titre de comparaison, le Unitree G1 reste l'une des rares références sous 20 000 dollars sur le marché mondial; les offres Figure 03, Agility Digit ou Boston Dynamics Electric Atlas se négocient bien au-delà. Si le T1 tient ses performances hors laboratoire, il pourrait abaisser la barrière d'entrée pour des secteurs à marges serrées comme la logistique légère ou l'assemblage à faible volume. Il convient cependant d'être prudent: Astribot liste des tâches réussies sans publier de métriques de cadence ni de données de robustesse en conditions industrielles réelles, et les vidéos de démonstration restent sélectionnées par l'entreprise. C'est une ouverture de commandes, pas un déploiement en volume documenté. Fondée en 2022 et basée à Shenzhen, Astribot s'est fait connaître à la World Robot Conference de Pékin en août 2024 avec le S1, humanoïde bimanuel de 170 cm et 90 kg aux 23 DOF (7 par bras, 4 pour le torse, 2 pour la tête, 3 pour la base omnidirectionnelle). Une publication arXiv de juillet 2025 détaillait la suite logicielle Astribot Suite, combinant collecte de données en réalité virtuelle, politiques d'imitation learning et optimisation de trajectoire en temps réel, avec des taux de réussite annoncés entre 80 et 100% sur tâches sélectionnées. La startup a levé environ 100 millions de dollars depuis 2024. Sur le segment prix du T1, les concurrents directs incluent le Unitree G1 et, dans une moindre mesure, les robots de recherche comme le GR00T N2 de NVIDIA. Aucun acteur européen ne se positionne encore clairement sur ce créneau accessible. La démonstration de robustesse en milieu non contrôlé et l'annonce de premiers clients industriels constitueront les prochaines étapes décisives pour valider l'ambition commerciale d'Astribot.

UELa démocratisation des prix sur ce segment pourrait inciter des intégrateurs européens à évaluer un pilote humanoïde, mais aucun déploiement ni partenariat européen n'est mentionné.

Dossier arXiv cs.RO — page 14

Vidéo : un humanoïde chinois à 13 000 dollars pour démocratiser la robotique avancée

Comment apprendre aux robots : comparaison entre guidage kinesthésique, joystick et gestes

ICAN-Deploy : déploiement canari à identité stable pour agents incarnés en environnements critiques

POINav : évaluation et amélioration de l'arrivée aux derniers mètres en navigation vision-langage réelle

Vers une intelligence incarnée partagée pour les robots humanoïdes : développement et tests du robot ergoCub

LAD-VF : la différentiation automatique par LLM permet la planification robotique sans ajustement fin à partir de méthodes formelles

Exploiter un potentiel variable : quand le contrôle réactif suffit aux comportements multi-objectifs

Les modèles VLA peuvent-ils apprendre en continu depuis des données réelles sans oublier ?

Apprentissage de séquences d'actions continues haute fréquence dans l'espace latent

Contrôle par échantillonnage en temps réel sous contraintes strictes : l'approche MPPI avec contraintes de variété

Commande corpo-entière sûreté-critique pour robots humanoïdes via les barrières de contrôle entrée-état

IsaacIPC : simulation haute fidélité et rendu réaliste couplés pour la robotique en contact

Modèles vision-langage-action (VLA) efficaces pour les longues séquences via découplage statique-dynamique

Distillation neuronale de Koopman dynamique pour le contrôle robotique en temps réel par modèles de diffusion

RepSAM : adapter les modèles fondation à la vision robotique par guidage de représentation

Accessibilité différentiable parallèle pour l'apprentissage et la planification avec dynamiques neuronales et contrôleurs certifiés

LIBERO-PRO : vers une évaluation robuste et équitable des modèles vision-langage-action (VLA) au-delà de la mémorisation

Comprendre les défaillances multimodales dans le clonage comportemental par découpage d'actions

Attention par transport optimal spatio-temporel pour l'apprentissage par imitation visuo-tactile de manipulations avec contact

TimeRewarder : apprendre des récompenses denses à partir de vidéos passives via la distance temporelle entre images

Amélioration du SLAM par graphes en environnement sans GNSS grâce à l'odométrie des jambes

VLANeXt : recettes pour construire des modèles VLA performants

EllipseLIO : odométrie inertielle LiDAR adaptative par représentation ellipsoïdale

Du contact balayé à la pose : recalage adapté à la sonde par ancrage de formes complémentaires

Sélectionner ou ne pas sélectionner : distillation de la prédiction de compétences robotiques en petit ensemble

COBALT : apprentissage robotique collaboratif par téléopération cloud via smartphones

CEER : contrôle unifié de l'effecteur final souple et de la base pour la loco-manipulation hiérarchique des humanoïdes

LLMs incarnés : quand une meilleure fidélité d'observation nuit à la résolution de problèmes

Gouverneur de référence explicite pour manipulateurs robotiques souples et adaptés au contact

TaskGround : inférence de tâches exécutables structurées pour le raisonnement domestique global

DexWild : des interactions humaines dextériques pour des politiques robotiques en conditions réelles

Je ne suis pas en colère, juste concentré : comprendre les émotions humaines dans la collaboration humain-robot

REBAR : un référentiel éthique de référence pour l'évaluation de l'autonomie

SADP : politique de diffusion consciente des sous-objectifs pour robots explicables, apprise à partir de démonstrations générées par modèle fondation

cuNRTO : optimisation de trajectoires robustes non linéaires accélérée par GPU

Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions

Apprentissage de la continuation native pour les politiques de flux par découpage d'actions

OpenFrontier : navigation générale guidée par des frontières vision-langage

Approximation du MPC global à contact implicite par échantillonnage et complémentarité locale

STABLE : génération d'agencements de table prêts à la simulation via un système dual sémantique-physique

Détection des événements d'attaque du talon et de décollage des orteils par méthodes cinématiques et modèles LSTM

Permettre aux robots de ressentir le toucher : alignement cortical visuo-tactile pour la résonance miroir incarnée

AttenA+ : corriger l'inégalité des actions dans les modèles fondation pour la robotique

FrameSkip : apprendre à partir de moins de frames mais plus informatifs dans l'entraînement des modèles VLA

Quand l'état absolu échoue : évaluation des encodages proprioceptifs pour une manipulation robuste

Unifier les actions du robot dans le référentiel caméra

TinySDP : optimisation semi-définie en temps réel pour une robotique embarquée certifiable et agile

Manipulation robotique par imitation de vidéos générées, sans démonstrations physiques

Self-CriTeach : auto-enseignement et auto-critique d'un LLM pour améliorer la planification robotique

Distillation de simulation : pré-entraîner des modèles du monde en simulation pour une adaptation rapide au réel