
Tutorat bidirectionnel pour l'apprentissage moteur développemental en robotique : dynamiques co-développées et stabilité
Une équipe de chercheurs a publié sur arXiv (référence 2606.19728, juin 2026) une étude portant sur l'apprentissage moteur développemental des robots, inspirée de la manière dont les nourrissons acquièrent leurs compétences motrices via l'interaction avec leurs aidants. L'expérience centrale implique un robot humanoïde physique chargé d'une tâche de manipulation d'objets, soumis à deux protocoles distincts : d'abord une interaction humain-robot en temps réel, puis un tuteur IA doté d'un mécanisme d'intervention adaptatif conçu pour reproduire la même dynamique bidirectionnelle dans des conditions plus contrôlées. Le système d'apprentissage repose sur un réseau de neurones fondé sur le principe de l'énergie libre (free-energy principle, FEP), étendu par un mécanisme de rejeu génératif (generative replay) permettant un apprentissage stable séquence par séquence à partir d'épisodes tutorés uniques.
L'hypothèse centrale, vérifiée dans les deux configurations, est que le tutorat bidirectionnel produit des comportements plus cohérents et une généralisation par étapes (stage-wise generalization), le robot requérant progressivement moins de guidage externe. Cela tranche avec le paradigme dominant de l'apprentissage par démonstration (learning from demonstration, LfD), où le robot reçoit passivement des flux de téléopération sans que ses expériences passées contraignent la dynamique d'interaction. Pour les intégrateurs et ingénieurs roboticiens, l'implication est concrète : les stratégies d'entraînement actuelles, largement fondées sur des démonstrations unidirectionnelles comme celles utilisées par Figure, Tesla Optimus ou Physical Intelligence, pourraient négliger un levier important de cohérence comportementale et de robustesse à la distribution.
Ce travail s'inscrit dans la tradition de la robotique développementale, un champ qui emprunte aux sciences cognitives du développement pour concevoir des agents capables d'apprentissage progressif et socialement ancré. Il faut toutefois nuancer : il s'agit d'un preprint arXiv non encore évalué par les pairs, réalisé sur un robot unique dans des conditions expérimentales contrôlées, sans déploiement industriel ni partenariat commercial annoncé. La prochaine étape naturelle serait de tester la scalabilité du protocole sur plusieurs morphologies de robots et sur des tâches plus complexes, afin d'évaluer si la dynamique bidirectionnelle conserve ses avantages au-delà de la manipulation d'objets simples.
Dans nos dossiers




