
Debate2Create : la co-conception de robots par débat multi-agents
Des chercheurs ont présenté sur arXiv (2510.25850, v3) Debate2Create (D2C), un cadre multi-agent LLM qui aborde la co-conception robotique comme un débat structuré et itératif entre agents spécialisés, ancré dans un évaluateur physique. Un agent de conception gère la morphologie du robot tandis qu'un agent de contrôle propose les fonctions de récompense ; les deux s'affrontent en boucle thèse-antithèse-synthèse, supervisés par des juges LLM dédiés à des critères distincts. Testé sur cinq benchmarks de locomotion MuJoCo (Ant, Swimmer, HalfCheetah, Hopper, Walker2d), D2C obtient le meilleur score normalisé parmi toutes les baselines LLM et boîte noire évaluées, avec des gains de 3,2x sur Ant et de près de 9x sur Swimmer. Le débat itératif génère 18 à 35 % de performance supplémentaire par rapport à une génération zero-shot à budget de calcul équivalent, et les récompenses produites transfèrent aux morphologies par défaut dans 4 tâches sur 5.
La co-conception robotique, qui consiste à optimiser simultanément la morphologie et la politique de contrôle d'un robot, est un problème combinatoire difficile, traditionnellement confié à des algorithmes évolutionnaires ou à des méthodes d'optimisation bayésienne coûteuses en calcul. Le résultat clé de D2C n'est pas le score absolu mais le gain systématique du débat itératif sur le zero-shot à budget équivalent : cela signale un avantage architectural réel, pas un simple effet d'échelle. Le transfert des récompenses générées aux morphologies standards dans 4 cas sur 5 propose une séparation réutilisable entre exploration morphologique et politique de contrôle, directement pertinente pour les intégrateurs travaillant sur des plateformes matérielles fixes.
Ce travail s'inscrit dans un courant actif qui mobilise les LLM pour automatiser la conception de robots, aux côtés de cadres comme EvoPrompting et des pipelines LLM-to-sim explorés par les équipes de Nvidia et DeepMind. La singularité de D2C est l'ancrage dans une évaluation physique en boucle fermée pendant le débat, plutôt que dans la seule génération de code. Les benchmarks restent contraints à des topologies fixes et le transfert sim-to-real n'est pas abordé, deux limites qui situent la contribution dans le registre de la recherche fondamentale ; les prochaines étapes naturelles sont l'extension à des morphologies à topologie variable et la validation sur matériel réel.
Dans nos dossiers




