RechercheInteresting Engineering6sem

Des scientifiques américains développent des robots autonomes capables d'apprendre directement auprès des chercheurs

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

L'Argonne National Laboratory, laboratoire fédéral américain rattaché au Département de l'Énergie (DOE), a annoncé le développement de RoSA (Robot Scientific Assistant for Accelerating Experimental Workflows), un projet visant à créer des robots capables d'apprendre les procédures expérimentales directement en observant des chercheurs humains. L'approche repose sur l'imitation par démonstration : les scientifiques portent des capteurs pendant leurs manipulations, permettant de capturer mouvements, flux de travail et processus de décision, données qui alimentent ensuite des modèles d'IA chargés de reproduire correctement ces protocoles. Nicola Ferrier, informaticienne senior spécialisée en vision par ordinateur, dirige le volet robotique, tandis qu'Arvind Ramanathan contribue son expertise en systèmes de décision autonomes. Trois configurations matérielles sont envisagées : bras robotiques fixes, robots humanoïdes, et systèmes hybrides combinant mobilité et précision stationnaire. Les systèmes seront d'abord validés en simulation virtuelle avant tout déploiement en environnement réel. L'équipe cible une multiplication par cinq de l'efficacité sur les tâches ciblées d'ici un an. RoSA alimentera également OPAL (Orchestrated Platform for Autonomous Laboratories), initiative DOE parallèle visant à créer des réseaux de laboratoires autonomes capables d'apprentissage indépendant, notamment pour des expériences biologiques.

Ce projet marque un changement d'approche dans la robotisation scientifique : plutôt que de programmer manuellement chaque geste, l'équipe d'Argonne parie sur l'imitation learning, une méthode qui supprime la phase de programmation explicite pour chaque nouveau protocole. Pour les intégrateurs et les décideurs B2B, cela ouvre la perspective de robots reconfigurables sur simple démonstration humaine, sans expertise en robotique embarquée. L'enjeu est concret : automatiser les tâches répétitives ou dangereuses (pipetage, manipulation de produits chimiques, expériences à haute cadence) améliorerait à la fois la sécurité et la reproductibilité des résultats. Quelques réserves s'imposent néanmoins : l'objectif x5 d'efficacité n'est qu'une cible interne sur douze mois, sans métriques de référence publiées ni benchmark externe validé, et aucun déploiement opérationnel en laboratoire réel n'est encore annoncé. La distance entre validation en simulation et robustesse en environnement de laboratoire réel constitue le principal risque d'exécution de ce type de projet.

RoSA s'inscrit dans la Genesis Mission du DOE, initiative nationale mobilisant IA, informatique quantique et supercalculateurs pour doubler la productivité de la recherche américaine dans la décennie. Le segment des "self-driving laboratories" est en pleine croissance : le groupe Cronin à l'Université de Glasgow a publié des résultats emblématiques sur un laboratoire chimique autonome piloté par IA, Emerald Cloud Lab (États-Unis) propose déjà des services de laboratoire entièrement automatisés à distance, et des équipementiers comme Beckman Coulter ou Tecan fournissent des plateformes d'automatisation avancées au marché pharmaceutique. Argonne cherche à se positionner comme référence en robotique scientifique généraliste, au-delà des tâches chimiques ou biologiques standardisées déjà couvertes par ces acteurs. La prochaine étape annoncée reste la démonstration du gain x5 d'efficacité, préalable à une intégration progressive aux équipements existants de laboratoires partenaires.

À lire aussi

1Interesting Engineering

Des chercheurs développent un module de protection inspiré de l'armadillo pour la robotique souple

Des chercheurs de la North Carolina State University ont publié le 27 mai dans la revue Science Advances un module de protection autonome baptisé Morpho-Interlocking Protective Module (MIPM), conçu en s'inspirant directement de la morphologie du tatou. Le dispositif repose sur une architecture en trois couches : un exosquelette externe composé d'écailles en résine imprimées en 3D, une couche centrale de détection et d'actionnement intégrant un capteur de déformation en polymère élastique chargé de nanofils d'argent, un tissu conducteur chauffant, un élastomère à cristaux liquides (LCE) et du ruban Kapton, ainsi qu'un endosquelette interne formé de nervures en papier rigide portant des écailles polymères en interverrouillage. Lorsque le capteur détecte une contrainte mécanique, il déclenche une impulsion électrique vers la couche chauffante : la chaleur provoque une contraction du LCE simultanément à une dilatation du Kapton, forçant le module à se replier en position curvée. Les écailles d'endosquelette s'imbriquent alors en un squelette interne rigide capable d'absorber des forces allant jusqu'à 10 newtons pour une configuration à 10 écailles segmentaires, selon les tests réalisés en laboratoire. Ce résultat est notable dans le contexte de la robotique molle, un champ en forte croissance où la fragilité mécanique reste un obstacle systémique. Le MIPM apporte une réponse autonome et réversible sans requérir d'actionneur dédié ni de supervision externe. L'équipe a établi une relation mathématique précise entre le nombre d'écailles de l'endosquelette, la rigidité obtenue et la masse du dispositif, permettant de calibrer directement le niveau de protection selon le payload à défendre. Ce ratio est utilisable pour dimensionner l'armure selon des contraintes d'intégration réelles. L'architecture ne se cantonne pas à une rigidité passive : la transformation est déclenchée par le module lui-même, ce qui ouvre la voie à des protections embarquées sur drones de recherche en milieu confiné ou sur implants médicaux flexibles soumis aux mouvements articulaires, deux cas d'usage explicitement cités par les auteurs. Il reste toutefois à valider le comportement en cycles répétés et en conditions réelles d'intégration, absents de la publication. Le projet est porté par Yong Zhu, professeur Andrew A. Adams en génie mécanique et aérospatial à NC State, et par Jianyu Zhou, chercheur postdoctoral et premier auteur. Il s'inscrit dans un effort plus large de la communauté robotique molle pour combler le fossé entre flexibilité d'usage et robustesse opérationnelle, un défi que les blindages rigides classiques ne peuvent résoudre sans sacrifier la compliance mécanique. Aucun concurrent direct n'est mentionné dans la publication, mais des approches similaires de protection adaptative existent en phase exploratoire dans plusieurs laboratoires de matériaux actifs. L'équipe NC State recherche activement des partenaires industriels pour industrialiser le dispositif, sans calendrier précis annoncé à ce stade.

RecherchePaper

1 source

2arXiv cs.RO

Tutorat bidirectionnel pour l'apprentissage moteur développemental en robotique : dynamiques co-développées et stabilité

Une équipe de chercheurs a publié sur arXiv (référence 2606.19728, juin 2026) une étude portant sur l'apprentissage moteur développemental des robots, inspirée de la manière dont les nourrissons acquièrent leurs compétences motrices via l'interaction avec leurs aidants. L'expérience centrale implique un robot humanoïde physique chargé d'une tâche de manipulation d'objets, soumis à deux protocoles distincts : d'abord une interaction humain-robot en temps réel, puis un tuteur IA doté d'un mécanisme d'intervention adaptatif conçu pour reproduire la même dynamique bidirectionnelle dans des conditions plus contrôlées. Le système d'apprentissage repose sur un réseau de neurones fondé sur le principe de l'énergie libre (free-energy principle, FEP), étendu par un mécanisme de rejeu génératif (generative replay) permettant un apprentissage stable séquence par séquence à partir d'épisodes tutorés uniques. L'hypothèse centrale, vérifiée dans les deux configurations, est que le tutorat bidirectionnel produit des comportements plus cohérents et une généralisation par étapes (stage-wise generalization), le robot requérant progressivement moins de guidage externe. Cela tranche avec le paradigme dominant de l'apprentissage par démonstration (learning from demonstration, LfD), où le robot reçoit passivement des flux de téléopération sans que ses expériences passées contraignent la dynamique d'interaction. Pour les intégrateurs et ingénieurs roboticiens, l'implication est concrète : les stratégies d'entraînement actuelles, largement fondées sur des démonstrations unidirectionnelles comme celles utilisées par Figure, Tesla Optimus ou Physical Intelligence, pourraient négliger un levier important de cohérence comportementale et de robustesse à la distribution. Ce travail s'inscrit dans la tradition de la robotique développementale, un champ qui emprunte aux sciences cognitives du développement pour concevoir des agents capables d'apprentissage progressif et socialement ancré. Il faut toutefois nuancer : il s'agit d'un preprint arXiv non encore évalué par les pairs, réalisé sur un robot unique dans des conditions expérimentales contrôlées, sans déploiement industriel ni partenariat commercial annoncé. La prochaine étape naturelle serait de tester la scalabilité du protocole sur plusieurs morphologies de robots et sur des tâches plus complexes, afin d'évaluer si la dynamique bidirectionnelle conserve ses avantages au-delà de la manipulation d'objets simples.

RecherchePaper

1 source

3arXiv cs.RO

Quand un robot surpasse l'humain : apprendre auprès de démonstrateurs contraints

Des chercheurs ont publié sur arXiv (2510.09096, version 3, mai 2026) une approche algorithmique permettant à un robot d'apprendre une politique de contrôle plus efficace que celle démontrée par un opérateur humain contraint. Le constat de départ est simple : les interfaces classiques d'apprentissage par démonstration, enseignement kinesthésique, joystick, transfert sim-to-real, imposent des contraintes physiques ou logicielles qui empêchent l'expert de montrer un comportement optimal. Un joystick, par exemple, ne pilote un bras robotique que dans un plan 2D, alors que le robot est capable de trajectoires dans un espace à six degrés de liberté ou plus. Sur un bras WidowX en conditions réelles, la méthode proposée complète une tâche de manipulation en 12 secondes, soit dix fois moins que le behavioral cloning classique dans les mêmes conditions. L'enjeu dépasse la performance brute. Pour les intégrateurs industriels et les équipes de robotique appliquée, cela signifie qu'une démonstration médiocre, captée en atelier par un opérateur avec un contrôleur limité, n'est plus un plafond de performance. Le système infère un signal de récompense uniquement à partir des états observés (sans avoir besoin des actions de l'expert), puis étend ce signal aux états non explorés par interpolation temporelle. Le robot peut ainsi emprunter des chemins que l'humain n'a jamais montrés, réduisant la longueur des trajectoires et le temps de cycle. C'est une rupture par rapport au paradigme standard de l'imitation : au lieu de copier le geste, la machine reconstruit l'intention et optimise librement pour l'atteindre. Cela répond directement à l'un des points de friction majeurs du déploiement terrain, où la qualité des données de démonstration est rarement maîtrisée. L'apprentissage par imitation (imitation learning / LfD) est un domaine actif depuis plusieurs années, avec des approches comme GAIL, IRL ou DAgger. Ce travail s'inscrit dans le courant de l'apprentissage par renforcement inverse (IRL) contraint, mais avec une spécificité : il ne suppose pas que l'expert est optimal, ce qui le distingue de la majorité des formulations classiques. Les concurrents directs sur ce créneau incluent des travaux récents autour de VLA (Vision-Language-Action models) comme pi-0 de Physical Intelligence, qui cherchent également à généraliser au-delà des démonstrations vues. Le bras WidowX utilisé est une plateforme open-source abordable, ce qui favorise la reproductibilité. Les prochaines étapes naturelles seraient la validation sur des tâches multi-étapes et des morphologies robotiques plus complexes, notamment des humanoïdes où le gap entre contraintes de télé-opération et capacités physiques réelles est particulièrement marqué.

UEImpact indirect : les laboratoires européens (INRIA, CEA-List) et intégrateurs industriels travaillant sur l'apprentissage par démonstration pourraient exploiter cette approche IRL, mais aucun acteur FR/EU n'est impliqué dans la publication.

RecherchePaper

1 source

4Interesting Engineering

MIT développe un bracelet à ultrasons pour apprendre aux robots humanoïdes la dextérité des mains humaines

Des chercheurs du Massachusetts Institute of Technology, dirigés par Xuanhe Zhao, ont présenté un bracelet ultrasonique portable capable de capturer les mouvements de muscles, tendons et ligaments sous la peau du poignet. Le dispositif intègre un système d'imagerie sans fil à 256 canaux couplé à un modèle d'IA hybride Transformer-ResNet qui interprète en temps réel l'activité musculaire subtile. Il suit en continu les 22 degrés de liberté de la main humaine, couvrant l'ensemble des mouvements de flexion, rotation et coordination des doigts et de la paume, avec une latence mesurée à 120 millisecondes. Lors de tests en laboratoire impliquant huit volontaires, le bracelet a reproduit des gestes avec une précision suffisante pour reconnaître les 26 lettres de l'alphabet américain des signes (ASL). Opérant sans fil, il permet de piloter des systèmes robotiques à distance sans connexion physique directe. L'objectif affiché par l'équipe : utiliser les données collectées pour entraîner des robots humanoïdes à reproduire les tâches manuelles délicates que les humains réalisent naturellement. Ce travail adresse l'un des goulots d'étranglement les plus persistants de la robotique : la capture précise et non intrusive de la dextérité manuelle. Les solutions actuelles souffrent de limites connues, les systèmes à caméra étant sensibles aux occlusions et aux angles de vue, tandis que l'électromyographie (EMG), les capteurs inertiels ou les jauges de déformation manquent souvent de résolution pour les mouvements continus des doigts ou contraignent les gestes. En se positionnant sous la peau par imagerie ultrasonique, le bracelet MIT contourne ces contraintes tout en atteignant une couverture complète des 22 degrés de liberté. Pour les équipes qui collectent des données de téléopération destinées à l'apprentissage par imitation, notamment pour alimenter des pipelines VLA comme Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA), un tel dispositif pourrait enrichir significativement la qualité des démonstrations humaines utilisées à l'entraînement. Il reste cependant à valider ces performances hors laboratoire, sur des populations plus larges et dans des conditions de bruit musculaire réel, un point que la publication initiale n'aborde pas. Cette recherche s'inscrit dans une progression rapide des ultrasons portables amorcée au MIT et dans d'autres laboratoires. Depuis 2022, des équipes ont successivement démontré la surveillance multi-organes en continu, l'imagerie cardiaque portable et des patchs à résolution sub-millimétrique ; en 2024, l'Université de Californie à San Diego avait présenté un système comparable basé sur l'IA pour l'interprétation des gestes du bras, fonctionnel même en conditions dynamiques (course, véhicule en mouvement, mer agitée). Sur le plan concurrentiel, des acteurs comme CTRL-Labs (acquis par Meta en 2019) ou les fournisseurs d'EMG avancé tels que Delsys et Noraxon explorent des espaces adjacents, mais l'approche ultrasonique revendique une résolution spatiale potentiellement supérieure pour les structures profondes. L'équipe MIT n'a pas encore annoncé de partenariats industriels ni de calendrier de commercialisation : le dispositif reste aujourd'hui au stade de démonstration de laboratoire.

RechercheOpinion

1 source