
Un cadre d'apprentissage par renforcement neuromorphique pour la planification de chemin efficace dans les systèmes robotisés de préparation de commandes
Une équipe de chercheurs a publié sur arXiv (référence 2606.20031) le framework SDQN-RMFS, une chaîne de traitement complète qui associe apprentissage par renforcement et calcul neuromorphique pour la navigation de robots mobiles dans les systèmes d'exécution d'entrepôts (RMFS, Robotic Mobile Fulfillment Systems). Le pipeline fonctionne en deux temps : une politique est d'abord entraînée sur un réseau de neurones artificiel (ANN) classique, en pleine précision, via une stratégie d'entraînement autorisant les collisions afin de densifier les trajectoires informatives. Elle est ensuite convertie en réseau de neurones impulsionnels (SNN, Spiking Neural Network) grâce à une distillation de connaissance à labels durs (hard-label knowledge distillation), technique qui compense le décalage de distribution entre les deux architectures. Déployé sur puce neuromorphique, le système atteint jusqu'à 11 281 fois d'économies d'énergie par rapport à une baseline GPU haute performance, avec une réduction de latence de près de 2×, sans dégradation mesurable de la qualité de décision.
Ces résultats sont significatifs pour quiconque opère un entrepôt automatisé à grande échelle : l'énergie consommée par les unités de calcul embarquées constitue un poste de coût non négligeable dès que la flotte dépasse quelques centaines d'AMR (autonomous mobile robots). La contribution technique principale est de démontrer, sur matériel réel et non en simulation, qu'une politique RL peut survivre à la conversion ANN-vers-SNN sans effondrement de performance, un point de friction longtemps considéré comme rédhibitoire pour le déploiement neuromorphique industriel. Le travail valide également l'approche sim-to-real dans un contexte d'entrepôt dense et dynamique, là où les méthodes classiques de planification de chemin (A*, règles heuristiques) peinent à répondre en temps réel sous contrainte de ressources.
Les RMFS sont au coeur des entrepôts d'Amazon Robotics (issu de l'acquisition de Kiva Systems), de Geek+ ou d'Hai Robotics, mais aussi du français Exotec, dont le système Skypod mobilise des flottes de plusieurs milliers de robots. Le calcul neuromorphique mobilise des acteurs comme Intel (puce Loihi 2) et des laboratoires académiques européens autour de BrainScaleS. Ce preprint n'a pas encore été soumis à révision par les pairs, et les conditions exactes des expériences matérielles (type de puce, taille de l'entrepôt simulé, densité de flotte) mériteraient d'être précisées avant tout benchmark concurrentiel. Les prochaines étapes logiques seraient un pilote en entrepôt réel et une évaluation sur flottes hétérogènes.
Exotec (Skypod) et les laboratoires européens autour de BrainScaleS sont directement concernés par cette avancée en calcul neuromorphique qui pourrait réduire drastiquement les coûts énergétiques des flottes AMR à grande échelle.
Dans nos dossiers




