Aller au contenu principal
CADENCE : prédiction du temps d'exécution réel en MAPF au-delà de la somme des coûts
RecherchearXiv cs.RO1h

CADENCE : prédiction du temps d'exécution réel en MAPF au-delà de la somme des coûts

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié le 4 juin 2026 CADENCE (Coordination and Action-Driven Estimation for Networked Continuous Execution), une étude expérimentale sur la prédiction du temps d'exécution réel dans les systèmes multi-robots. Le protocole repose sur une cellule de travail fixe de 7x7 cases équipée de sept robots à roues différentielles, sur laquelle 120 plans ont été générés à travers 15 scénarios, cinq en espace vide, cinq en disposition aléatoire intermédiaire, cinq en configuration goulot d'étranglement. Chaque plan a été exécuté quatre fois, constituant un corpus expérimental de 480 essais physiques. L'objectif central : déterminer quelles métriques calculables avant l'exécution permettent de prédire le temps réel de complétion (wall-clock time), à partir de deux modèles statistiques distincts, un modèle ridge par scénario tenu hors entraînement, et un modèle à effets mixtes au niveau essai.

Le résultat principal remet en cause un postulat central de l'évaluation MAPF : la Sum of Costs (SoC), métrique quasi-universelle pour comparer les planificateurs, s'avère insuffisante pour estimer le temps d'exécution réel. C'est le "primitive motion burden", une mesure composite qui quantifie les virages, transitions start-stop, mouvements consécutifs et la longueur brute des trajectoires primitives, qui réduit l'erreur de prédiction de 48,6 à 59,8 % en MAE et de 44,2 à 61,4 % en RMSE par rapport aux modèles SoC seuls. Les métriques de coordination inter-robots (liens de dépendance, paires en interaction, profondeur des dépendances) apportent des gains plus modestes et moins stables. Pour un intégrateur d'entrepôt ou un concepteur de flotte AMR, cela signifie qu'un plan jugé optimal sur SoC peut induire des temps de cycle réels significativement plus longs, une erreur coûteuse à l'échelle industrielle.

MAPF est un domaine actif depuis plusieurs décennies, avec des algorithmes comme CBS (Conflict-Based Search) ou ECBS largement utilisés dans les systèmes de gestion de flotte pour entrepôts automatisés, notamment chez des acteurs comme 6 River Systems, Locus Robotics, ou Exotec en Europe. La question de l'écart entre planification hors-ligne et exécution physique (le "sim-to-real gap" de la planification de chemin) est un angle sous-exploré dans la littérature. CADENCE propose un premier corpus empirique structuré pour combler ce manque, mais reste limité à une topologie fixe, un type de robot unique, et un nombre restreint de scénarios. Les prochaines étapes naturelles incluent des cellules plus grandes, des robots hétérogènes, et l'intégration de ces features dans des planificateurs adaptatifs capables d'arbitrer en temps réel entre coût planifié et charge de mouvement prédite.

Impact France/UE

Exotec, acteur français leader de la logistique automatisée, est directement concerné : ses systèmes de flotte AMR optimisés sur Sum of Costs pourraient sous-estimer les temps de cycle réels, un risque opérationnel mesurable à l'échelle industrielle.

Dans nos dossiers

À lire aussi

Bon modèle au bon moment : commande prédictive en cascade de fidélité pour la marche bipède en temps réel
1arXiv cs.RO 

Bon modèle au bon moment : commande prédictive en cascade de fidélité pour la marche bipède en temps réel

Des chercheurs ont soumis sur arXiv le 6 mai 2026 (arXiv:2605.04607) une méthode de contrôle prédictif multi-phase pour la marche bipède, validée en simulation MuJoCo sur HyPer-2, un robot bipède à 18 degrés de liberté. L'approche, dite "cascaded-fidelity MPC", divise l'horizon de prédiction en deux zones : les pas de temps proches s'appuient sur un modèle complet du corps entier (whole-body model), tandis que l'horizon lointain utilise un modèle simplifié à corps rigide unique (SRB). Le problème de commande optimale non linéaire résultant est résolu par programmation quadratique séquentielle (SQP) via le framework acados. Le contrôleur calcule directement des couples articulaires à partir d'un calendrier de contacts et d'une vitesse cible, sans exiger d'emplacements de pas prédéfinis. Il s'agit d'un preprint de recherche ; aucun transfert sur matériel physique n'est encore rapporté. L'enjeu est d'ordre computationnel : un MPC whole-body complet offre une haute précision dynamique mais reste prohibitif pour un contrôle embarqué temps réel, tandis que les méthodes simplifiées (LIPM, SRBD seul) dégradent la qualité de prédiction. Concentrer la fidélité du modèle sur l'horizon proche, là où elle impacte réellement la commande, est un compromis prometteur. L'absence de dépendance aux pas présélectionnés renforce également la robustesse potentielle en environnement non structuré. Ce travail s'inscrit dans une compétition académique dense autour du MPC pour la locomotion humanoïde. Des équipes comme ETH Zurich avec le framework OCS2, Carnegie Mellon ou des laboratoires européens explorent des hiérarchisations de modèles analogues. HyPer-2 semble être une plateforme de recherche universitaire non commercialisée. Les prochaines étapes attendues sont le transfert sim-to-real sur matériel physique et la validation sur terrain irrégulier.

RecherchePaper
1 source
Affordance2Action : ancrage des affordances guidé par la tâche pour la manipulation en temps réel
2arXiv cs.RO 

Affordance2Action : ancrage des affordances guidé par la tâche pour la manipulation en temps réel

Une équipe de chercheurs publie sur arXiv (identifiant 2606.04172) le framework Affordance2Action (A2A), centré sur un problème concret de la manipulation robotique : identifier en temps réel quelle partie précise d'un objet est fonctionnellement exploitable pour accomplir une tâche donnée, dans une scène encombrée et ambigüe. Le coeur du travail est A2A-Bench, un benchmark de manipulation couvrant à la fois les correspondances instruction-région unique et multi-région, c'est-à-dire les cas où un seul verbe d'action peut pointer vers une ou plusieurs zones fonctionnelles selon la disposition de la scène. Pour construire ce dataset à grande échelle, les auteurs ont développé A2A-AffordGen, un pipeline assisté par agents qui enchaîne filtrage par modèle de langage, segmentation interactive de parties, raffinement par masquage d'instance, génération d'instructions de raisonnement et vérification humaine. Le code et les datasets seront rendus publics. Ce travail expose une lacune structurelle des benchmarks existants en affordance : la plupart se concentrent sur la préhension d'objet isolé, s'appuient sur des scènes synthétiques, ou supposent une correspondance univoque entre instruction et région. A2A révèle des écarts significatifs dans trois catégories de baseline (segmentation générique, grounding fondé sur des VLMs et distillation d'affordance) sur des scènes réelles et multi-objets. Pour un intégrateur ou un responsable d'automatisation, ce résultat indique que les approches actuelles basées sur des VLMs généralistes (type CLIP ou LLaVA) sous-performent dès que la scène sort des cas standards. La capacité à localiser des régions fonctionnelles ambigües en temps réel reste un verrou non résolu pour le déploiement de bras manipulateurs en environnement non structuré. L'affordance grounding en robotique s'inscrit dans une longue tradition de recherche remontant aux travaux de Gibson sur les affordances écologiques, réinterprétés pour la manipulation depuis les années 2010. Les approches concurrentes incluent des méthodes de grounding fondées sur des modèles de vision-langage (CLIP, SAM couplé à LLM) et des politiques de type VLA (Vision-Language-Action), comme pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, qui nécessitent elles aussi une localisation précise des régions d'interaction. A2A se positionne comme un cadre d'évaluation et de supervision plutôt que comme une politique de contrôle complète. La prochaine étape logique serait une validation sur robots physiques à plus grande échelle : le papier démontre des résultats en manipulation conditionnée par les affordances, mais la portée reste expérimentale à ce stade de preprint.

RecherchePaper
1 source
Capteur cutané conforme pour la cartographie en temps réel de la forme
3arXiv cs.RO 

Capteur cutané conforme pour la cartographie en temps réel de la forme

Des chercheurs ont présenté sur arXiv (preprint 2605.01170, mai 2025) un capteur souple et conforme capable de reconstruire en temps réel la déformation tridimensionnelle d'une surface flexible, sans recourir à la vision. Le dispositif intègre un réseau 2D de jauges de contrainte imprimées à base d'indium-gallium eutectique oxydé (o-EGaIn), emboîtées en miroir dans un film élastomère. Un réseau de 5x5 capteurs espacés de 12 mm mesure les contraintes hors axe neutre, et un modèle d'observation informé par la mécanique des matériaux, couplé à une routine d'optimisation rapide, estime simultanément la courbure locale, l'élongation, le décalage et l'orientation. Le système atteint une erreur moyenne de reconstruction de surface de 0,62 mm avec une latence de 100 ms, testée sur des scénarios combinant étirement, flexion et indentation. Les démonstrations incluent le suivi de gestes de la paume, l'indentation par un doigt, et la déformation d'un ballon sous contact. Ce résultat est notable parce qu'il adresse une limitation structurelle des approches visuelles existantes : la nécessité d'une ligne de visée et d'une instrumentation complexe, incompatibles avec les environnements occultés ou à espace contraint, notamment la chirurgie mini-invasive, les prothèses ou les doigts de préhension robotique. La précision sub-millimétrique à 10 Hz ouvre un espace d'utilisation pour le suivi épidermique du mouvement, l'interaction haptique à retour de forme, et la surveillance peropératoire en temps réel, sans nécessiter de marqueurs externes ni de caméras. Il s'agit cependant d'un preprint académique : aucun produit n'est annoncé ni commercialisé. Les capteurs à base d'EGaIn liquide-métal sont étudiés depuis une décennie pour leur déformabilité et leur conductivité, mais la reconstruction 3D continue à partir de mesures de contraintes distribuées reste un problème ouvert. Les approches concurrentes incluent les capteurs à fibre optique (FBG), plus précis mais rigides et coûteux, et les peaux tactiles matricielles à base de matériaux piézorésistifs ou capacitifs. Ce travail se distingue par la combinaison d'une fabrication par impression, d'un modèle mécanique intégré et d'une latence compatible avec le contrôle en boucle fermée. Les prochaines étapes naturelles sont l'intégration sur un effecteur robotique souple ou un instrument chirurgical, et la tenue à l'autoclave pour la stérilisation.

RecherchePaper
1 source
Prédiction de la stabilité de préhension sans contact par capteurs ToF intégrés en main
4arXiv cs.RO 

Prédiction de la stabilité de préhension sans contact par capteurs ToF intégrés en main

Des chercheurs ont publié sur arXiv (arXiv:2605.05461, mai 2025) une méthode de prédiction de stabilité de préhension sans contact physique, reposant sur des capteurs ToF (time-of-flight) multi-zones intégrés dans les liaisons distales d'un préhenseur robotique. Contrairement aux approches existantes qui détectent l'échec de saisie uniquement après contact avec l'objet, ce système évalue la stabilité de la prise en amont de tout contact, à une fréquence de 15 Hz. Le jeu de données d'entraînement comprend plus de 2 500 saisies réelles effectuées sur 15 objets distincts. Le classificateur a ensuite été évalué sur 6 objets inédits, trois pour la validation et trois pour le test, avec des précisions respectives de 85,5 % et 86,0 %. Le gain pratique est direct : en découplant la prédiction de stabilité de la phase de contact, on réduit significativement le temps de cycle et, surtout, on évite des tentatives de saisie vouées à l'échec avant même qu'elles ne démarrent. Pour un intégrateur industriel ou un COO confronté à des lignes de picking à cadence élevée, cela se traduit par moins d'interruptions, moins de manipulations correctives, et une meilleure robustesse face aux variations de capteurs. La fréquence de 15 Hz est compatible avec des boucles de contrôle temps réel. Il faut toutefois rester mesuré : le corpus d'entraînement reste modeste (15 objets, 2 500 grasps), et les résultats sur objets "unseen" portent sur un échantillon de seulement trois pièces de test, ce qui rend la généralisation à des catalogues industriels réels encore incertaine. La prédiction de stabilité de saisie est un problème central en manipulation robotique depuis plusieurs décennies. Les approches tactiles, dominantes dans la littérature récente, offrent une richesse d'information mais imposent un contact préalable et nécessitent des capteurs coûteux et fragiles. Les capteurs ToF, eux, sont bon marché, robustes et déjà embarqués dans de nombreux systèmes. Ce travail s'inscrit dans un courant plus large visant à exploiter des modalités de capteurs proximaux, sans contact, pour la planification de mouvement, aux côtés de travaux sur les caméras de profondeur et les capteurs capacitifs. La prochaine étape naturelle sera de valider l'approche sur des objets déformables ou transparents, catégories notoirement problématiques pour les capteurs ToF, et de tester la robustesse en conditions d'éclairage variable.

RecherchePaper
1 source