
WorkBenchMark : un benchmark d'assemblage basé sur LEGO avec une approche assemblage-par-désassemblage pour la Smart Manufacturing League
Des chercheurs ont publié WorkBenchMark, un benchmark d'assemblage robotique basé sur des briques LEGO Duplo, conçu dans le cadre de la RoboCup Smart Manufacturing League. Il comprend 400 tâches réparties en quatre niveaux de complexité croissante, couvrant la manipulation de pièces, leur positionnement et leur emboîtement sous contraintes physiques. L'équipe propose également une solution de référence baptisée "Assembly-by-Disassembly" : plutôt que d'apprendre directement l'assemblage, le système utilise la désassemblage pour inférer les étapes inverses, couplé à une perception en vocabulaire ouvert. Le benchmark, l'environnement de simulation et l'implémentation de référence seront publiés en open source.
Ce qui retient l'attention est le résultat de l'évaluation comparative : le pipeline à base de planification symbolique surpasse une approche moderne de type VLA (Vision-Language-Action) sur l'ensemble des quatre niveaux de difficulté. C'est un signal notable pour le secteur, car les VLA sont actuellement présentées comme la voie principale vers la manipulation généraliste. L'assemblage est précisément le type de tâche qui met en défaut les approches bout-en-bout : il nécessite à la fois une précision de manipulation millimétrique et un raisonnement symbolique sur des séquences d'étapes interdépendantes, une combinaison que les modèles end-to-end ne résolvent pas encore de façon fiable à grande échelle.
WorkBenchMark s'inscrit dans la tradition des benchmarks robotiques standardisés, similaire à ce que YCB ou NIST Assembly ont représenté pour la préhension et l'assemblage industriel. La RoboCup Smart Manufacturing League, qui en est le cadre compétitif, cible explicitement les cas d'usage de manufacture intelligente. Face aux approches concurrentes comme pi0 de Physical Intelligence ou les pipelines VLA de Google DeepMind, ce travail soutient l'hypothèse que la planification hybride reste compétitive pour les tâches structurées, et offre à la communauté un terrain d'évaluation reproductible pour en débattre.
Le benchmark open-source pourrait bénéficier aux laboratoires de recherche européens actifs en manipulation robotique industrielle, mais aucun acteur FR/EU n'est directement impliqué.
Dans nos dossiers




