
Learn2Decompose : décomposition de problèmes pour planifier efficacement la manipulation séquentielle de multiples objets
Des chercheurs ont publié sur arXiv (identifiant 2408.06843, cinquième révision soumise en 2025) une méthode baptisée Learn2Decompose, conçue pour réduire les temps de planification dans des tâches de manipulation séquentielle d'objets multiples en environnements dynamiques. L'approche s'appuie sur trois composantes distinctes : la décomposition d'objectifs (goal decomposition), qui découpe le problème global en séquences de sous-objectifs intermédiaires que le robot doit atteindre successivement ; l'apprentissage de distance computationnelle, qui prédit la complexité de planification entre deux états pour identifier le sous-objectif le plus proche après une perturbation de la scène ; et la réduction de l'ensemble d'objets actifs (object reduction), qui limite le nombre d'objets considérés à chaque étape de replanification. La méthode est évaluée sur trois benchmarks de manipulation robotique, sans que les gains chiffrés exacts soient communiqués dans le résumé public du papier.
L'enjeu est direct : les solveurs classiques de TAMP (Task And Motion Planning) souffrent d'une complexité exponentielle à mesure que l'horizon de planification s'allonge et que le nombre d'objets augmente. En environnement industriel réel, entrepôt, ligne d'assemblage, cellule de picking, cette explosion combinatoire rend les approches TAMP difficiles à déployer sans contraintes fortes sur la taille des scènes. En apprenant des décompositions depuis des démonstrations humaines plutôt qu'en énumérant l'espace de plans, Learn2Decompose introduit un biais inductif qui réduit l'espace de recherche sans abandonner les garanties formelles du planificateur sous-jacent. L'idée de prédire une "distance computationnelle" entre états comme proxy du coût de replanning est méthodologiquement notable : elle permet au système de se reconfigurer dynamiquement après une perturbation, sans relancer une planification globale depuis zéro.
Le TAMP est un domaine classique de la robotique, avec des travaux fondateurs au MIT, à Stanford et à CMU depuis les années 2010. La tension entre robustesse des planificateurs symboliques et leur passage à l'échelle reste un problème ouvert. Deux familles de réponses s'affrontent : les approches entièrement apprenantes comme les VLA (vision-language-action models) ou les diffusion policies telles que Pi-0 de Physical Intelligence, qui évitent le planificateur formel mais peinent sur les tâches longue-durée avec de nombreux objets ; et les approches hybrides comme Learn2Decompose, qui conservent le planificateur mais l'accélèrent par apprentissage automatique. Des acteurs comme Intrinsic (spin-off Google X) ou des équipes académiques comme celles derrière PDDLStream investissent dans des directions similaires. La cinquième révision du papier indique un cycle de peer review itératif ; les résultats quantitatifs complets et les comparaisons systématiques avec d'autres accélérateurs TAMP méritent consultation dans le manuscrit intégral.
Dans nos dossiers




