Clonage comportemental à grande échelle : données ouvertes, entraînement et évaluation
Une équipe de chercheurs a publié fin juin 2026 ABC, une infrastructure entièrement open-source dédiée à la manipulation robotique par behavior cloning. La pièce centrale est ABC-130K, actuellement le plus grand jeu de données de téléopération en accès libre : 3 500 heures de données réparties sur plus de 130 000 épisodes couvrant 195 tâches distinctes. En complément, les auteurs publient un setup matériel accessible, une infrastructure d'entraînement, un pipeline de simulation, et 400 heures supplémentaires de données de téléopération simulée. Les politiques entraînées sur ce corpus exécutent des tâches de dextérité fine comme le pliage de boîtes cartonnées ou l'extraction de cartes de crédit depuis un portefeuille.
L'enjeu principal est celui de la reproductibilité et de l'équité dans la recherche en apprentissage par imitation. Jusqu'ici, les grandes équipes bénéficiaient d'un accès privilégié à des datasets propriétaires massifs, creusant l'écart avec les laboratoires académiques plus modestes. ABC propose une recette de co-entraînement simulation/réel corrélée qui permet de comparer les choix architecturaux (DiT, Diffusion Transformer, ou VLA, Vision-Language-Action) avant toute évaluation réelle coûteuse, ce qui représente un gain de temps et de budget substantiel pour les intégrateurs. La corrélation sim-to-real est cependant validée sur un périmètre limité de tâches de table-top et non sur des scénarios industriels complexes : les auteurs proposent un proxy fiable, pas une solution universelle.
Le behavior cloning, qui consiste à apprendre une politique directement à partir de démonstrations humaines sans modéliser de fonction de récompense, a connu un regain d'intérêt depuis les travaux de Stanford sur Diffusion Policy en 2023 et l'émergence des architectures VLA comme pi0 de Physical Intelligence ou OpenVLA. Dans cet espace concurrentiel, où Physical Intelligence, Google DeepMind et 1X Technologies publient des datasets propriétaires ou des modèles partiellement ouverts, ABC se positionne comme une alternative entièrement libre visant à démocratiser la recherche en manipulation. Les suites naturelles incluent l'extension à des morphologies robotiques variées et à des tâches bi-manuelles, qui restent hors du périmètre actuel de la plateforme.
Les laboratoires académiques européens (INRIA, CEA-List) et start-ups de manipulation peuvent exploiter directement ABC-130K et son pipeline sim-to-real open-source pour réduire l'écart de données avec les grandes équipes disposant de datasets propriétaires.




