DAG-Plan : génération de graphes de dépendances acycliques orientés pour la planification coopérative à deux bras
Une équipe de chercheurs propose DAG-Plan, un framework de planification de tâches pour robots à deux bras qui utilise un graphe orienté acyclique (DAG, Directed Acyclic Graph) comme représentation centrale de la coordination. Publiés sur arXiv (identifiant 2406.09953v4), les travaux font état d'un taux de réussite supérieur de 48 % par rapport aux méthodes à séquence linéaire sur système bi-bras, et d'une efficacité d'exécution en hausse de 84,1 % face aux approches à requêtes LLM itératives. L'évaluation a été conduite sur un benchmark de cuisine bi-bras, un scénario de manipulation multi-étapes comportant des dépendances non linéaires entre sous-tâches. Le principe clé : le LLM n'est sollicité qu'une seule fois, pour traduire une instruction en langage naturel en DAG structuré, puis le système assigne dynamiquement les noeuds candidats à chaque bras selon les observations en temps réel de l'environnement.
L'intérêt industriel est réel, car le goulot d'étranglement des systèmes bi-bras actuels n'est pas mécanique mais algorithmique. Les méthodes linéaires échouent dès qu'une tâche impose du parallélisme ou une adaptation en cours d'exécution ; les méthodes itératives basées sur des appels LLM répétés génèrent une latence incompatible avec les cadences industrielles. DAG-Plan tranche ce compromis en séparant la phase de raisonnement sémantique (une seule inférence LLM hors-ligne) de la phase d'exécution adaptative (décisions locales basées sur l'observation). Pour les intégrateurs et les équipes R&D en robotique, cela suggère qu'un LLM peut jouer un rôle de planificateur structurel sans devenir un point de défaillance en temps réel. Les gains annoncés sont néanmoins à contextualiser : le benchmark cuisine reste un environnement contrôlé, et les vidéos de démonstration présentées sur le site du projet sont sélectionnées, ce qui ne permet pas d'évaluer la robustesse sur des variations de scène réelles.
La planification de tâches pour robots bi-bras est un terrain de recherche actif depuis plusieurs années, avec des approches concurrentes comme Task and Motion Planning (TAMP) ou les méthodes de raisonnement LLM développées dans le cadre de SayCan (Google), Code-as-Policies ou Inner Monologue. DAG-Plan s'inscrit dans la vague des frameworks qui exploitent les LLM comme parseurs sémantiques plutôt que comme planificateurs en boucle fermée, une direction explorée aussi par des travaux comme RoboScript ou LEGO-PLAN. Aucun partenaire industriel ni déploiement hors-labo n'est mentionné dans la publication ; il s'agit d'une contribution académique avec code ouvert, disponible sur le site du projet. Les suites naturelles seraient une validation sur des robots commerciaux (FANUC, Universal Robots, ABB) et des scènes moins structurées que la cuisine, pour tester la généralisation du formalisme DAG à des environnements à perturbations stochastiques.
Dans nos dossiers



