Aller au contenu principal
InfrastructurearXiv cs.RO1h

Construction d'un jeu de données robotique modélisée comme un processus de build par artefacts

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs de l'Université de la Bundeswehr Munich (UniBwTAS) ont publié Bagzel, une extension open source pour le système de build Bazel qui modélise la construction de jeux de données robotiques comme un processus basé sur des artefacts et un graphe de dépendances. Présenté sur arXiv (référence 2606.00162), l'outil convertit des enregistrements ROS bag en jeux de données prêts pour l'entraînement ML, avec export natif au format nuScenes. Les auteurs évaluent Bagzel et une variante Bagzel-xattr (gestion des digests côté serveur) contre un pipeline séquentiel de référence rosbag2nuscenes, sur des volumes de 5,1 à 20,4 Go. En mode warm build (recalcul sur données déjà traitées), Bagzel atteint une accélération jusqu'à 386,26x par rapport au baseline séquentiel ; en mode incrémental (après modification partielle du dataset), le gain est de 7,21x. Bagzel-xattr réduit en outre le temps d'exécution de 5,9 % en moyenne par rapport à Bagzel standard.

Le goulet d'étranglement que cible Bagzel est bien connu des équipes de robotique appliquée : les scripts séquentiels ad hoc imposent de recalculer l'intégralité du dataset à chaque modification, allongeant les cycles d'itération de plusieurs heures. En appliquant les principes de reproductibilité et de build incrémental du génie logiciel au traitement de données capteurs multimodales, Bagzel rend viable l'exploration rapide de paramètres de preprocessing, le débogage de pipelines de perception, et la maintenance de datasets versionnés de manière déterministe. Pour un intégrateur ou une équipe de recherche manipulant régulièrement des dizaines de gigaoctets de données capteurs, réduire le temps de rebuild d'un facteur plusieurs centaines change concrètement le rythme d'expérimentation.

Le format ROS bag reste le standard de facto pour l'enregistrement de données capteurs (lidar, caméra, IMU) en conditions réelles, tant en recherche qu'en industrie, mais sa conversion vers des formats ML exploitables est généralement assurée par des scripts maison non maintenables. Bagzel s'inscrit dans une tendance de professionnalisation du MLOps en robotique, un espace où des outils comme DVC ou Foxglove Studio couvrent des parties du problème sans offrir la cohérence d'un système de build unifié. Le laboratoire TAS de l'UniBwM est actif sur les thématiques de conduite autonome et de perception embarquée. Les prochaines étapes naturelles pour Bagzel concernent l'intégration avec des pipelines d'entraînement continu et l'extension à d'autres formats standardisés comme le Waymo Open Dataset.

Impact France/UE

L'outil est développé par l'Université de la Bundeswehr Munich (Allemagne/UE), renforçant l'outillage MLOps open source européen pour les équipes de robotique et de conduite autonome manipulant des données capteurs ROS.

Dans nos dossiers

À lire aussi

L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL
1Robotics Business Review 

L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL

La connectivité vision dans les systèmes robotiques traverse une mutation structurelle. Pendant près d'une décennie, les intégrateurs ont déployé des caméras USB ou Ethernet (protocole GigE Vision) pour alimenter les pipelines de perception des robots. L'USB, bon marché et universellement supporté, suffisait au prototypage, mais ses contraintes de longueur de câble, sa latence non déterministe et sa charge CPU élevée l'ont rendu inadapté aux plateformes complexes. GigE Vision a ensuite étendu la portée et standardisé les interfaces entre fournisseurs, au prix d'un processeur embarqué sur chaque caméra pour packetiser les données, ajoutant latence et complexité réseau. Aujourd'hui, le GMSL (Gigabit Multimedia Serial Link), conçu initialement pour les systèmes caméra de l'automobile, s'impose comme alternative de référence dans les architectures robotiques de nouvelle génération. Ce standard transmet des images non compressées, un contrôle bidirectionnel et l'alimentation électrique sur un unique câble coaxial ou paire torsadée blindée, sur plusieurs mètres de portée, adapté aux plateformes mobiles et articulées. La tendance est claire : les robots modernes embarquent désormais huit capteurs d'images ou plus, répartis sur l'ensemble de la structure, pour des fonctions allant de l'évitement d'obstacles à la manipulation dextre et à l'interaction humain-robot. L'enjeu pour les intégrateurs et décideurs B2B est celui du déterminisme. Les systèmes USB et Ethernet souffrent d'arbitrage et de buffering qui introduisent une variabilité de latence incompatible avec la perception temps réel : boucles de contrôle pour la manipulation, fusion LiDAR-IMU-caméra, vision stéréo synchronisée. GMSL établit une liaison point-à-point dédiée par caméra vers un calculateur centralisé (GPU embarqué ou FPGA), éliminant ces aléas. C'est un changement d'architecture, pas simplement d'interface : le traitement migre vers un noeud central unique plutôt que d'être fragmenté sur chaque caméra. Pour les plateformes qui doivent fusionner données RGB, LiDAR, radar et IMU avec une synchronisation stricte - typiquement les humanoïdes et les AMR de nouvelle génération - ce déterminisme est une exigence fonctionnelle, pas un confort. Le GMSL est issu de l'industrie automobile, où Analog Devices (ADI), principal promoteur de la technologie, l'a développé pour répondre aux exigences des systèmes ADAS et de conduite autonome : robustesse électromagnétique, temps réel, longues portées de câble. Ce transfert technologique auto-vers-robotique s'inscrit dans une dynamique plus large du secteur, où plusieurs standards automotive (Ethernet TSN, MIPI CSI-2) trouvent des débouchés dans les plateformes robotiques. ADI n'est pas seul sur ce créneau : Texas Instruments et NVIDIA proposent leurs propres écosystèmes de connectivité vision pour la robotique, et le choix d'interface reste un facteur de différenciation dans les appels d'offres industriels. À noter que l'article source est publié par ADI lui-même, ce qui invite à lire les métriques comparatives avec le recul habituel vis-à-vis des communications techniques de fournisseurs. La prochaine étape du secteur sera probablement la standardisation : des consortiums comme MIPI Alliance travaillent à harmoniser les interfaces caméra pour faciliter l'interopérabilité entre fournisseurs de capteurs, de calculateurs et intégrateurs robot.

UELes intégrateurs robotiques européens peuvent être amenés à intégrer le GMSL dans leurs cahiers des charges pour les nouvelles plateformes, mais aucun acteur ou réglementation FR/EU n'est directement impliqué.

InfrastructureActu
1 source
Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique
2Robotics & Automation News 

Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique

Lightwheel, startup américaine spécialisée dans l'infrastructure pour robots physiques, annonce avoir enregistré environ 100 millions de dollars de commandes au cours du seul premier trimestre 2026. La société développe des briques logicielles dédiées à la simulation, à la génération de données synthétiques, à l'évaluation de modèles et au déploiement à l'échelle de robots pilotés par de l'intelligence artificielle physique. Le communiqué ne précise ni les clients ni les volumes unitaires concernés, ce qui limite la portée des chiffres annoncés. Ce résultat, s'il se confirme, illustre un changement de phase dans le secteur : les industriels cessent d'expérimenter et commencent à chercher des solutions d'infrastructure clé-en-main pour passer des prototypes au déploiement réel. L'infrastructure de formation, simulation haute fidélité, pipelines de données synthétiques, évaluation en boucle fermée, émerge comme un marché autonome, distinct de la fabrication des robots eux-mêmes. Pour les intégrateurs et les équipes d'automatisation, cela signifie que la question n'est plus seulement "quel robot acheter ?" mais "quelle stack d'entraînement et de qualification choisir ?". Lightwheel s'inscrit dans l'écosystème dit de la "physical AI", terme popularisé par NVIDIA avec sa plateforme Isaac et ses partenaires comme Agility Robotics, Boston Dynamics ou Figure. Ses concurrents directs sur le segment données-simulation incluent Scale AI, Synthesis AI et les stacks propriétaires que développent en interne les fabricants de robots humanoïdes. La prochaine étape à surveiller : des références clients nommées et des métriques de déploiement réel, seuls indicateurs capables de valider que la demande annoncée se traduit en robots effectivement opérationnels en production.

InfrastructureActu
1 source
SFG-ROS : un framework de perception multi-agents dense adaptatif aux ressources
3arXiv cs.RO 

SFG-ROS : un framework de perception multi-agents dense adaptatif aux ressources

Des chercheurs de la Hochschule Esslingen (Allemagne) ont publié en mai 2026 sur arXiv un framework logiciel nommé SFG-ROS, conçu pour déployer des flottes hétérogènes de robots en perception collaborative multi-agents. Le système cible un problème bien documenté de ROS 2 : lorsque plusieurs robots échangent simultanément des flux denses de capteurs (LiDAR, caméras stéréo de profondeur), le middleware standard génère une saturation réseau rapide, des collisions de namespaces et une charge CPU qui croît avec le nombre d'abonnés. SFG-ROS propose trois mécanismes correctifs. D'abord, un routage de trafic piloté par schéma qui isole les flux haute fréquence intra-agent du réseau global via un schéma de nommage pleinement qualifié et un routage Fast DDS ciblé. Ensuite, un pipeline de décodage centralisé à la demande qui externalise la décompression des données capteur vers un noeud dédié, supprimant le traitement redondant côté consommateurs. Enfin, un pipeline de conteneurisation agnostique au matériel qui s'adapte dynamiquement aux accélérateurs hétérogènes, du poste de développement jusqu'au déploiement terrain sans reconfiguration. Les tests menés sur une flotte mixte de robots à roues et de robots marchants montrent que SFG-ROS borne le trafic réseau en O(1) quelle que soit la taille de la flotte, et réduit la pénalité CPU par abonné de 72,3 % par rapport à ROS 2 standard, sans dégradation de latence mesurée. Ce résultat de 72,3 % de réduction CPU est significatif pour les intégrateurs industriels qui opèrent des flottes mixtes en conditions réelles : il signifie concrètement qu'ajouter un nouveau robot consommateur de données ne fait pas croître linéairement la charge de traitement sur les noeuds existants. La propriété O(1) sur le réseau est peut-être encore plus critique : elle autorise des déploiements à grande échelle sans redimensionnement de l'infrastructure réseau, ce qui change le calcul économique des entrepôts automatisés multi-AMR ou des chantiers robotisés. L'approche agnostique au matériel répond à une friction fréquente en intégration : les pipelines ROS 2 sont souvent reconfigurés manuellement à chaque changement de plateforme (Jetson, GPU server, CPU embarqué). SFG-ROS automatise ce pont, ce qui réduit le temps de mise en service. Toutefois, les résultats proviennent d'un preprint non encore évalué par les pairs, et les conditions expérimentales exactes (taille de flotte testée, volume de données par canal, latence cible) ne sont pas détaillées dans le résumé disponible, ce qui limite la transposabilité directe des chiffres à d'autres configurations. SFG-ROS est publié sous licence permissive par l'Institut für Intelligente Systeme de la Hochschule Esslingen, une école d'ingénieurs allemande active en robotique embarquée et systèmes cyber-physiques. Le projet s'inscrit dans une tendance plus large de l'écosystème ROS 2 à combler les limites de scalabilité de DDS pour les flottes denses, tendance où l'on retrouve aussi des travaux de l'Université de Bonn, d'Apex.AI ou encore des efforts de standardisation du ROS 2 TSC autour de la qualité de service DDS. Du côté des alternatives, des frameworks propriétaires comme LCM (Lightweight Communications and Marshalling) ou les middlewares internes de Boston Dynamics et ANYbotics offrent des garanties similaires mais sans interopérabilité ouverte. SFG-ROS se positionne comme une couche d'orchestration open-source au-dessus de ROS 2 existant, ce qui abaisse la barrière à l'adoption. Le code est accessible sur iis-esslingen.github.io/sfg-ros, et la prochaine étape logique serait une validation sur des flottes de taille industrielle (dizaines d'agents) avec des benchmarks de latence publiés sous charge réelle.

UEPublié sous licence permissive par une école d'ingénieurs allemande, SFG-ROS est directement exploitable par les intégrateurs européens de flottes multi-robots (entrepôts AMR, chantiers robotisés) pour scaler leurs déploiements ROS 2 sans redimensionner l'infrastructure réseau.

InfrastructureOpinion
1 source
GMSL et l'écosystème croissant autour des systèmes de vision pour la robotique
4Robotics Business Review 

GMSL et l'écosystème croissant autour des systèmes de vision pour la robotique

Le standard GMSL (Gigabit Multimedia Serial Link), longtemps cantonné aux systèmes embarqués automobiles comme l'ADAS, s'impose progressivement dans les architectures de vision robotique industrielle. Selon Stephen Liu, responsable robotique chez Advantech, développeur de systèmes embarqués, environ un tiers des projets robotiques qu'il accompagne utilisent ou envisagent déjà des caméras GMSL. La technologie permet de transporter vidéo haute résolution, signaux de contrôle et synchronisation sur un unique câble léger, avec une latence déterministe et une résistance aux interférences électromagnétiques (EMI) significativement améliorée. Analog Devices (ADI), qui dispose d'un écosystème GMSL structuré -- modules caméra pré-validés, adaptateurs, BSP (Board Support Packages) et plateformes compatibles ROS -- positionne cette offre comme un raccourci entre preuve de concept et production de masse. L'adoption dépasse le stade POC : les plateformes AMR (robots mobiles autonomes) de logistique en sont les premiers utilisateurs en production, suivis par les robots humanoïdes, les stations de picking, les applications agricoles et certains usages en santé et construction. Ce glissement du GMSL vers la robotique répond à une contrainte système qui s'aggrave : à mesure que le nombre de capteurs embarqués augmente (caméras multiples, lidars, IMU), la gestion simultanée de la bande passante, de la latence et de la synchronisation devient le vrai goulot d'étranglement. Un décalage de quelques millisecondes entre les flux capteurs suffit à dégrader la précision de navigation. "Les robots ne font pas que voir, ils doivent décider et agir instantanément", résume Liu, ce qui impose une coordination serrée entre GPU, MPU et système d'exploitation temps réel. Dans des environnements difficiles -- vibrations, poussière, températures extrêmes, câblages longs dans des châssis compacts -- les contraintes d'ESD et d'intégrité de signal rendent les interfaces non-automotive-grade insuffisantes. Le GMSL apporte ici une robustesse éprouvée en conditions réelles, sans surcharger les équipes d'intégration d'une couche de développement bas niveau supplémentaire. La transition depuis l'automobile n'est pas anodine sur le plan industriel. Les chaînes d'outillage ADAS ont absorbé pendant une décennie les problèmes que la robotique affronte aujourd'hui : multiples caméras synchronisées, longues distances de câblage, tolérance zéro aux pannes de perception. ADI capitalise sur cet héritage pour proposer un écosystème directement transposable, réduisant les délais d'intégration de plusieurs mois à quelques semaines selon Advantech. Les concurrents directs sur ce segment -- notamment les acteurs proposant des solutions basées sur MIPI CSI-2 ou USB3 Vision -- restent pertinents pour les robots opérant en conditions contrôlées, mais peinent à répondre aux contraintes des déploiements extérieurs ou mobiles à longue durée. Les prochaines étapes portent sur l'extension vers les humanoïdes et les plateformes agricoles, segments où la densité sensorielle et la rugosité environnementale font du GMSL un candidat naturel face aux architectures plus conventionnelles.

UEL'adoption du GMSL dans les AMR et robots industriels concerne indirectement les intégrateurs et fabricants européens confrontés aux mêmes contraintes de synchronisation multi-capteurs dans leurs architectures de vision embarquée.

InfrastructureOpinion
1 source