Aller au contenu principal
SI-Diff : cadre d'apprentissage pour la recherche et l'insertion haute précision par diffusion dans le domaine des forces
IndustrielarXiv cs.RO6sem

SI-Diff : cadre d'apprentissage pour la recherche et l'insertion haute précision par diffusion dans le domaine des forces

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié en mai 2025 sur arXiv (2605.12247) SI-Diff, un framework d'apprentissage par imitation qui traite dans un seul modèle les deux phases de l'assemblage de précision : la recherche de position (search) et l'insertion proprement dite (high-precision insertion). Le système repose sur une politique de diffusion opérant dans le domaine des forces, couplée à un mécanisme de conditionnement par mode qui permet au réseau de distinguer les deux comportements d'action sans changer de poids ni de modèle. Un policy enseignant (teacher policy) génère en amont des trajectoires diversifiées, dont les démonstrations réussies et efficaces servent à l'entraînement supervisé. À l'inférence, le modèle prend en entrée les retours tactiles et la vitesse de l'effecteur terminal pour produire les commandes motrices. Résultat clé annoncé : SI-Diff tolère des désalignements x-y allant jusqu'à 5 mm, contre 2 mm pour TacDiffusion, le baseline état de l'art, et démontre un transfert zéro-shot sur des géométries non vues à l'entraînement.

Ce résultat mérite attention pour les intégrateurs industriels, car le principal frein au déploiement de l'assemblage robotisé de précision n'est pas la vitesse mais la robustesse aux incertitudes de pose, tolérances d'usinage, variabilité du picking, dérive thermique. Passer de 2 à 5 mm de tolérance sans recalibration ni modèle supplémentaire est un écart opérationnellement significatif sur une ligne de production réelle. Le choix du domaine force plutôt que vision pure pour la politique est aussi un signal : là où les VLA visuelles peinent sur les contacts sub-millimétrique, le retour tactile reste le vecteur le plus direct pour les tâches peg-in-hole. La transférabilité zéro-shot, si elle se confirme hors conditions de labo, réduit le coût de reconfiguration lors des changements de référence produit.

Le paper se positionne explicitement contre TacDiffusion (2024), qui reste la référence académique sur l'insertion tactile par diffusion. Plus largement, il s'inscrit dans la vague des politiques de diffusion pour la manipulation de contact, popularisées notamment par les travaux de Physical Intelligence (Pi-0) et les frameworks ouverts issus de Columbia et Stanford. Le peg-in-hole est un benchmark historique de la robotique d'assemblage, présent depuis les travaux de Nevins et Whitney dans les années 1970, ce qui rend les comparaisons directes interprétables. Il s'agit pour l'instant d'un résultat de recherche (preprint, pas encore évalué en peer review), sans déploiement industriel annoncé ni partenariat commercial mentionné. Les prochaines étapes naturelles seraient une validation sur cellule d'assemblage réelle multi-référence et une comparaison avec des approches hybrides force-vision.

À lire aussi

Un cadre d'apprentissage par renforcement neuromorphique pour la planification de chemin efficace dans les systèmes robotisés de préparation de commandes
1arXiv cs.RO 

Un cadre d'apprentissage par renforcement neuromorphique pour la planification de chemin efficace dans les systèmes robotisés de préparation de commandes

Une équipe de chercheurs a publié sur arXiv (référence 2606.20031) le framework SDQN-RMFS, une chaîne de traitement complète qui associe apprentissage par renforcement et calcul neuromorphique pour la navigation de robots mobiles dans les systèmes d'exécution d'entrepôts (RMFS, Robotic Mobile Fulfillment Systems). Le pipeline fonctionne en deux temps : une politique est d'abord entraînée sur un réseau de neurones artificiel (ANN) classique, en pleine précision, via une stratégie d'entraînement autorisant les collisions afin de densifier les trajectoires informatives. Elle est ensuite convertie en réseau de neurones impulsionnels (SNN, Spiking Neural Network) grâce à une distillation de connaissance à labels durs (hard-label knowledge distillation), technique qui compense le décalage de distribution entre les deux architectures. Déployé sur puce neuromorphique, le système atteint jusqu'à 11 281 fois d'économies d'énergie par rapport à une baseline GPU haute performance, avec une réduction de latence de près de 2×, sans dégradation mesurable de la qualité de décision. Ces résultats sont significatifs pour quiconque opère un entrepôt automatisé à grande échelle : l'énergie consommée par les unités de calcul embarquées constitue un poste de coût non négligeable dès que la flotte dépasse quelques centaines d'AMR (autonomous mobile robots). La contribution technique principale est de démontrer, sur matériel réel et non en simulation, qu'une politique RL peut survivre à la conversion ANN-vers-SNN sans effondrement de performance, un point de friction longtemps considéré comme rédhibitoire pour le déploiement neuromorphique industriel. Le travail valide également l'approche sim-to-real dans un contexte d'entrepôt dense et dynamique, là où les méthodes classiques de planification de chemin (A*, règles heuristiques) peinent à répondre en temps réel sous contrainte de ressources. Les RMFS sont au coeur des entrepôts d'Amazon Robotics (issu de l'acquisition de Kiva Systems), de Geek+ ou d'Hai Robotics, mais aussi du français Exotec, dont le système Skypod mobilise des flottes de plusieurs milliers de robots. Le calcul neuromorphique mobilise des acteurs comme Intel (puce Loihi 2) et des laboratoires académiques européens autour de BrainScaleS. Ce preprint n'a pas encore été soumis à révision par les pairs, et les conditions exactes des expériences matérielles (type de puce, taille de l'entrepôt simulé, densité de flotte) mériteraient d'être précisées avant tout benchmark concurrentiel. Les prochaines étapes logiques seraient un pilote en entrepôt réel et une évaluation sur flottes hétérogènes.

UEExotec (Skypod) et les laboratoires européens autour de BrainScaleS sont directement concernés par cette avancée en calcul neuromorphique qui pourrait réduire drastiquement les coûts énergétiques des flottes AMR à grande échelle.

IndustrielOpinion
1 source
Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention
2arXiv cs.RO 

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper
1 source
Automatisation robotique assistée par apprentissage automatique pour la fabrication industrielle
3arXiv cs.RO 

Automatisation robotique assistée par apprentissage automatique pour la fabrication industrielle

Des chercheurs ont présenté un système hybride baptisé Learning-Augmented Robotic Automation (LARA), déployé sur une ligne de production réelle de moteurs électriques pour automatiser deux tâches jusqu'alors confiées à des opérateurs humains : l'insertion de câbles déformables et la soudure. Le système combine des contrôleurs de tâches appris par imitation et un moniteur de sécurité neuronal 3D, intégré directement dans les workflows industriels existants. Entraîné avec moins de 20 minutes de données réelles par tâche, LARA a fonctionné en continu pendant 5 heures 10 minutes, produisant 108 moteurs sans barrière physique de protection, avec un taux de conformité de 99,4 % aux tests de contrôle qualité au niveau produit. Le takt time atteint est comparable à celui d'un opérateur humain, avec une réduction mesurée de la variabilité des joints de soudure et des temps de cycle. Ce résultat s'attaque directement au fossé entre démonstration laboratoire et déploiement industriel effectif, l'obstacle principal qui freine l'adoption de la robotique apprenante en production. L'entraînement en moins de 20 minutes par tâche abaisse considérablement la barrière à l'intégration pour les industriels et les intégrateurs système. Pour un COO de ligne d'assemblage, le point le plus structurant est l'absence de caging physique : le moniteur neuronal remplace les protections mécaniques classiques, ouvrant la voie à des cellules collaboratives sans les coûts de reconfiguration d'atelier associés aux robots industriels traditionnels. La manipulation de câbles déformables et la soudure figurent parmi les tâches les plus résistantes à la robotisation classique, du fait de la déformation matière et de la non-répétabilité des poses. Sur ce segment, Physical Intelligence (Pi-0.5) et Figure AI (Helix sur Figure 02) poussent des VLA généralistes pour la manipulation multi-tâches, tandis que Wandercraft et Enchanted Tools, tous deux français, ciblent respectivement la mobilité humanoïde et les robots de service. LARA se distingue par son pragmatisme : pas d'humanoïde, pas de modèle fondationnel, mais une hybridation ciblée sur des cellules industrielles existantes. Les auteurs évoquent comme suites naturelles l'extension à d'autres tâches de câblage et la validation sur des lignes multi-produits.

UELa fabrication de moteurs électriques est un segment clé de la transition EV en Europe ; LARA démontre qu'un système appris en moins de 20 minutes peut atteindre le takt time humain sur des tâches résistantes à la robotisation classique, abaissant directement la barrière d'adoption pour les intégrateurs et industriels européens sans reconfiguration lourde d'atelier.

IndustrielActu
1 source
Launchpad Build AI propose un outil d'apprentissage machine pour la conception en automatisation industrielle
4The Robot Report 

Launchpad Build AI propose un outil d'apprentissage machine pour la conception en automatisation industrielle

Launchpad Build AI, entreprise fondée en 2020 à Édimbourg sous le nom de Launchpad, a annoncé le 30 avril 2026 plusieurs jalons simultanés : le lancement de son Manufacturing Language Model (MLM), l'ouverture d'un siège américain à El Segundo en Californie, un rebranding, et la nomination de Ken Moynihan au poste de directeur technique. Moynihan apporte plus de vingt ans d'expérience en vision par ordinateur et robotique, avec des passages notamment chez TOMRA, spécialiste des systèmes de tri pilotés par IA. Le MLM est décrit par la société comme un modèle de langage spécifiquement entraîné sur des données issues d'environnements de production industrielle réels, capable de générer des configurations d'automatisation à partir d'une photo, d'une vidéo ou d'un fichier CAD. La société revendique une réduction du temps de conception et de déploiement de systèmes robotiques allant jusqu'à 50 %, avec une cible affichée de 99,8 % de taux d'efficacité opérationnelle. Ces annonces interviennent dans la continuité d'une levée de série A de 11 millions de dollars, réalisée l'année précédente avec des investisseurs comme Lavrock Ventures, Squadra Ventures, Lockheed Martin Ventures, la Scottish National Investment Bank et Ericsson Ventures. La proposition de valeur du MLM repose sur une approche délibérément spécialisée plutôt que généraliste : au lieu d'agréger des données internet hétérogènes, le modèle s'appuie sur des tolérances testées, des conditions opérationnelles documentées et des données de production en temps réel. Cette orientation est particulièrement pertinente pour les fabricants en haute-variété / faibles volumes (high-mix, low-volume), segment qui représente la majorité des industriels mais qui reste sous-servi par les solutions d'automatisation traditionnelles, conçues pour des lignes à grandes séries. Pour les intégrateurs et les décideurs industriels, l'enjeu est de taille : si le MLM tient ses promesses, il pourrait abaisser significativement la barrière d'entrée à la robotisation pour des PME manufacturières qui n'ont ni les ressources ni le temps pour des projets d'intégration longs et coûteux. Le système Digitool, qui utilise la vision robotique en temps réel pour gérer les variations de pièces et de processus, constitue un composant clé de cette autonomisation. Il reste à évaluer ces performances dans des conditions industrielles non contrôlées, hors démonstrations sélectives. Launchpad Build AI opère dans un espace de plus en plus encombré : des acteurs comme Vention, Symbio Robotics ou Rapid Robotics adressent également l'automatisation flexible pour PME, tandis que des plateformes comme Nvidia Isaac et ROS 2 industriel structurent le bas de la pile logicielle. La présence de Lockheed Martin Ventures au capital signale un intérêt potentiel pour des applications défense et aérospatiale, cohérent avec l'implantation à El Segundo, bassin historique de l'industrie aérospatiale américaine. Aucune date de disponibilité commerciale du MLM n'a été communiquée, ni de clients pilotes nommés publiquement, ce qui maintient ces annonces dans la catégorie des jalons produit plutôt que de déploiements validés à l'échelle.

IndustrielOpinion
1 source