Y-BotFrame : un cadre extensible d'agents…

Chalito : une bibliothèque extensible pour l'estimation d'état par filtrage chez les robots quadrupèdes

35

1arXiv cs.RO

Chalito : une bibliothèque extensible pour l'estimation d'état par filtrage chez les robots quadrupèdes

Des chercheurs présentent Chalito, une bibliothèque open source en MATLAB et Python conçue pour comparer les algorithmes d'estimation d'état par filtrage chez les robots quadrupèdes. L'outil importe directement les modèles de robots au format URDF (Unified Robot Description Format), prend en charge plusieurs approches de filtrage et a été pensé pour être facilement étendu à de nouvelles méthodes. Chalito fonctionne aussi bien sur des jeux de données simulées que sur des données réelles, ce qui permet une évaluation systématique à travers différents robots et différents filtres. Selon les auteurs, il s'agit de la première bibliothèque open source dédiée exclusivement au benchmarking d'algorithmes de filtrage pour quadrupèdes, un article publié sur arXiv le 14 juillet 2026 (arXiv:2607.09968v1). L'estimation d'état, c'est à dire la capacité d'un robot à déduire en temps réel sa position, sa vitesse et son orientation à partir de ses capteurs, conditionne directement la qualité de la locomotion, de la navigation et du contrôle des quadrupèdes. Or le secteur souffre d'un problème de fond largement sous-estimé hors des laboratoires : chaque équipe de recherche développe ses propres estimateurs, généralement couplés à un robot ou une pile logicielle spécifique, ce qui rend les comparaisons entre méthodes quasiment impossibles à mener équitablement. Cette fragmentation ralentit l'innovation algorithmique et complique la reproductibilité scientifique, un problème classique en robotique mais rarement adressé par un outil dédié. Un cadre de benchmarking standardisé comme Chalito pourrait donc devenir une référence pour comparer objectivement des approches de filtrage (par exemple les variantes de filtre de Kalman étendu) avant de les déployer sur du matériel réel. Le projet s'inscrit dans une tendance plus large de recherche sur l'infrastructure logicielle ouverte pour la robotique legged, à mesure que les plateformes quadrupèdes se multiplient dans la recherche académique et l'industrie. L'abstract ne précise pas quels robots ou filtres spécifiques sont déjà intégrés à la bibliothèque, ni de calendrier de publication du code ou de jeux de données associés. Les prochaines étapes attendues concernent vraisemblablement la publication effective du dépôt et l'ajout progressif de nouveaux algorithmes par la communauté.

RecherchePaper

1 source

TypeGo : un runtime système pour agents incarnés

38

2arXiv cs.RO

TypeGo : un runtime système pour agents incarnés

TypeGo est un nouveau runtime de type "système d'exploitation" pour agents incarnés, présenté dans un article arXiv (2607.05482v1) publié le 8 juillet 2026. Le prototype a été testé sur Kalos, un quadrupède Unitree Go2, et structure la planification par LLM en boucles asynchrones à plusieurs échelles de temps qui se chevauchent avec l'exécution physique du robot. Son composant central, le Skill Kernel, arbitre des sous-systèmes physiques typés entre plusieurs processus concurrents par tâche, tandis qu'un ordonnanceur peut préempter, reprendre ou remplacer ces processus selon leur source. Le système utilise aussi un mécanisme de "streaming" spéculatif de compétences qui masque la latence du LLM derrière le mouvement en cours, plus un chemin rapide pour la première action garantissant un retour visible en moins d'une seconde. Résultat mesuré sur la suite de tâches des chercheurs: le délai par étape chute de 50% par rapport à une planification pas-à-pas classique, et le délai avant première action baisse de 73% par rapport à une planification monolithique, avec une faible surcharge d'ordonnancement même en cas de tâches concurrentes. L'enjeu dépasse la simple optimisation de latence: TypeGo attaque un problème structurel largement ignoré par les démonstrations actuelles de robots pilotés par LLM, à savoir que traiter un modèle de langage comme un oracle requête/réponse sur le chemin critique de contrôle est incompatible avec le temps réel et la gestion de tâches concurrentes. En empruntant les principes d'un OS classique (gestion de ressources matérielles, préemption, ordonnancement) pour orchestrer un corps robotique, les auteurs proposent une réponse concrète à l'écart persistant entre les capacités de planification des VLA en démonstration et leur fiabilité en exécution réelle, sujet central pour tout intégrateur ou décideur évaluant le déploiement de robots pilotés par IA générative. Ce travail s'inscrit dans la lignée des architectures combinant LLM et contrôle robotique bas niveau, où la latence des modèles de langage reste un goulot d'étranglement majeur face aux exigences de réactivité physique. Il s'agit à ce stade d'un prototype de recherche académique, validé sur une suite de tâches restreinte avec un seul robot quadrupède, et non d'un produit commercialisé ou déployé en flotte. Les auteurs ne précisent pas de calendrier de transfert vers l'industrie, mais posent les bases conceptuelles d'un runtime générique que d'autres plateformes robotiques pourraient reprendre.

RecherchePaper

1 source

HARBOR : un cadre d'apprentissage par renforcement pour robots à base d'agents

42

3arXiv cs.RO

HARBOR : un cadre d'apprentissage par renforcement pour robots à base d'agents

Des chercheurs ont publié en juin 2026 sur arXiv (arXiv:2606.08610) HARBOR, un framework agentique conçu pour automatiser les pipelines d'apprentissage par renforcement (RL) appliqués à la robotique. Partant d'une spécification de tâche et d'une base de code simulateur, le système prend en charge l'ensemble du workflow : configuration de l'environnement, conception des fonctions de récompense, entraînement de la politique et tuning des hyperparamètres. HARBOR décompose ces objectifs de haut niveau en étapes bornées confiées à des agents spécialisés, coordonnés via des commandes standardisées, des artefacts persistants et des portes d'exécution vérifiables. Il scale l'itération par essais parallèles décentralisés et capitalise sur l'expérience accumulée entre les runs. Le framework a été évalué sur 6 benchmarks couvrant 16 tâches de manipulation, locomotion et contrôle bimanuel dextère. Les politiques entraînées en simulation ont ensuite été transférées sur de vrais robots. L'intérêt principal de HARBOR tient à ce qu'il attaque directement le principal frein à l'adoption du RL en robotique industrielle : la charge d'ingénierie experte requise pour chaque nouvelle tâche. Reward shaping, sélection d'algorithmes, tuning fin des hyperparamètres représentent aujourd'hui des semaines de travail spécialisé avant d'obtenir une politique viable. En automatisant ce cycle de bout en bout à un coût pratique en tokens et en temps de calcul, HARBOR abaisse concrètement la barrière d'entrée pour les intégrateurs et les équipes R&D industrielles. Le fait que les politiques se transfèrent au robot réel adresse le "sim-to-real gap", un verrou persistant du secteur. Les résultats publiés indiquent que le framework égale ou surpasse les configurations par défaut sur les benchmarks testés, bien que les conditions exactes d'évaluation méritent d'être examinées dans le papier complet avant d'en tirer des conclusions généralisées. HARBOR s'inscrit dans une tendance émergente qui consiste à utiliser des LLMs comme orchestrateurs de pipelines ML complexes, dans la lignée de travaux comme Eureka (NVIDIA, 2023), qui utilisait GPT-4 pour générer automatiquement des reward functions via evolutionary search, ou des approches AutoRL de Berkeley et Google DeepMind. HARBOR semble aller plus loin en couvrant l'intégralité du workflow plutôt que le seul reward design. Les auteurs ne sont pas identifiés dans l'abstract disponible, et aucune affiliation institutionnelle ni application industrielle spécifique n'est mentionnée : il s'agit d'un preprint de recherche, pas d'un produit commercialisé. Les prochaines étapes naturelles concerneront l'intégration avec des simulateurs standards (Isaac Sim, MuJoCo), des validations sur des plateformes humanoïdes complexes, et une éventuelle ouverture du code.

RecherchePaper

1 source

Un robot quadrupède amélioré pour le projet de fin d'études

36

4Hackaday Robots Hacks

Un robot quadrupède amélioré pour le projet de fin d'études

Aaed Musa, étudiant en génie mécanique, a présenté CARA 2.0 comme projet de fin d'études, aboutissement de plusieurs années de développement de chiens robotiques. Les exigences définies après des entretiens avec des clients potentiels étaient claires : prix cible autour de 1 000 dollars, poids inférieur à 9 kg (20 livres), et robustesse prouvée. Le robot reprend l'architecture de son prédécesseur CARA avec des transmissions par câble capstan, dont les éléments sont imprimés en résine et actionnés par des moteurs brushless de drone. Ces moteurs, initialement optimisés pour la vitesse plutôt que le couple, ont été rebobinés manuellement avec plus de fil, opération qui a permis de tripler leur couple. L'endurance a été validée par un test en cycle continu sur une seule articulation : plus de 1 000 heures de fonctionnement sans dégradation visible. En l'absence d'encodeurs absolus, chaque moteur effectue une mise à l'origine au démarrage en détectant la hausse de courant en fin de course mécanique, ce qui produit un mouvement d'étirement jugé naturel. CARA 2.0 est capable de marcher en ligne droite, de se déplacer latéralement, de pivoter sur place, de s'accroupir, de sauter et de maintenir son équilibre sur une surface inclinée. Le prix final atteint 1 450 dollars, légèrement au-dessus de l'objectif. Ce projet illustre qu'un quadrupède capable et durable reste accessible sans budget industriel, à condition d'accepter quelques compromis d'intégration. Le rebobinage manuel des moteurs pour adapter le rapport couple/vitesse est une solution peu documentée dans les projets open source de ce type ; elle démontre qu'un ajustement mécanique bas coût peut compenser l'absence de moteurs spécialisés. La détection de fin de course par surveillance du courant moteur, souvent utilisée en robotique industrielle, s'avère ici viable sur un système à faible coût. CARA 2.0 s'inscrit dans une lignée de projets personnels d'Aaed Musa, dont TOPS et la première version de CARA, tous deux basés sur des architectures capstan. Dans le segment des quadrupèdes accessibles, il se positionne face à des projets comme Stanford Doggo ou des dérivés open source du Boston Dynamics Spot, sans atteindre leurs performances dynamiques mais avec un coût de fabrication nettement inférieur. Aucun partenaire industriel ni déploiement commercial n'est mentionné à ce stade : CARA 2.0 reste un prototype académique, mais la méthodologie de validation client et les tests d'endurance suggèrent une trajectoire vers une éventuelle mise sur le marché.

RecherchePaper

1 source

Y-BotFrame : un cadre extensible d'agents incarnés pour robots quadrupèdes assistants

À lire aussi

Chalito : une bibliothèque extensible pour l'estimation d'état par filtrage chez les robots quadrupèdes

TypeGo : un runtime système pour agents incarnés

HARBOR : un cadre d'apprentissage par renforcement pour robots à base d'agents

Un robot quadrupède amélioré pour le projet de fin d'études