Aller au contenu principal

Infrastructure

35 articles

Infrastructure pour la robotique : puces spécialisées (NVIDIA Jetson, Thor), capteurs (lidars, cameras event), actuateurs, cloud-robotics.

NVIDIA Isaac Sim : une simulation GPU accélérée et évolutive pour la robotique
1arXiv cs.RO InfrastructureOpinion

NVIDIA Isaac Sim : une simulation GPU accélérée et évolutive pour la robotique

NVIDIA Isaac Sim s'est imposé comme une infrastructure centrale dans la recherche en robotique, et une étude de synthèse publiée sur arXiv (réf. 2606.03551) en propose la première analyse systématique. Contrairement aux simulateurs classiques comme Gazebo, PyBullet ou MuJoCo, Isaac Sim exploite l'accélération GPU pour permettre un entraînement parallèle à grande échelle et une modélisation physique haute fidélité. La plateforme intègre un pipeline de génération de données synthétiques qui pallie la rareté chronique des données d'entraînement de qualité, un verrou majeur pour le robot learning. Les auteurs analysent des études représentatives dans cinq grands domaines d'application et documentent les patterns d'usage dominants, notamment la génération de données et la simulation haute fidélité, sans se limiter à une liste de fonctionnalités marketing. L'enjeu industriel est significatif : la capacité à générer des données synthétiques crédibles et à entraîner des politiques en simulation massivement parallèle est aujourd'hui au coeur du débat sur le sim-to-real transfer. Pour les intégrateurs et les équipes R&D, une plateforme qui réduit le besoin de données réelles et compresse les cycles d'itération représente un avantage compétitif concret. Les auteurs pointent également les limites : la dépendance au matériel NVIDIA (GPU haut de gamme requis), des contraintes d'utilisabilité pratique, et des questions ouvertes autour de l'apprentissage en environnement ouvert (open-world learning), un domaine où aucun simulateur n'a encore apporté de réponse satisfaisante à l'échelle. Isaac Sim s'inscrit dans la stratégie plus large de NVIDIA dans la robotique, qui comprend le framework Isaac Lab, les modèles de fondation GR00T, et l'écosystème Omniverse. Face à lui, des alternatives open-source comme MuJoCo (DeepMind) ou Genesis gagnent du terrain, notamment pour leur accessibilité. L'étude identifie trois directions futures prioritaires : l'apprentissage physique en monde ouvert, les pipelines d'entraînement centrés sur la simulation, et la réduction des frictions d'adoption. Ces axes correspondent précisément aux blocages actuels pour industrialiser le déploiement de robots apprenants en dehors des labs.

UELes équipes R&D et laboratoires européens en robotique peuvent s'appuyer sur cette première analyse systématique pour arbitrer entre Isaac Sim et les alternatives open-source (MuJoCo, Genesis), notamment au regard de la dépendance au matériel NVIDIA haut de gamme.

1 source
Construction d'un jeu de données robotique modélisée comme un processus de build par artefacts
2arXiv cs.RO 

Construction d'un jeu de données robotique modélisée comme un processus de build par artefacts

Des chercheurs de l'Université de la Bundeswehr Munich (UniBwTAS) ont publié Bagzel, une extension open source pour le système de build Bazel qui modélise la construction de jeux de données robotiques comme un processus basé sur des artefacts et un graphe de dépendances. Présenté sur arXiv (référence 2606.00162), l'outil convertit des enregistrements ROS bag en jeux de données prêts pour l'entraînement ML, avec export natif au format nuScenes. Les auteurs évaluent Bagzel et une variante Bagzel-xattr (gestion des digests côté serveur) contre un pipeline séquentiel de référence rosbag2nuscenes, sur des volumes de 5,1 à 20,4 Go. En mode warm build (recalcul sur données déjà traitées), Bagzel atteint une accélération jusqu'à 386,26x par rapport au baseline séquentiel ; en mode incrémental (après modification partielle du dataset), le gain est de 7,21x. Bagzel-xattr réduit en outre le temps d'exécution de 5,9 % en moyenne par rapport à Bagzel standard. Le goulet d'étranglement que cible Bagzel est bien connu des équipes de robotique appliquée : les scripts séquentiels ad hoc imposent de recalculer l'intégralité du dataset à chaque modification, allongeant les cycles d'itération de plusieurs heures. En appliquant les principes de reproductibilité et de build incrémental du génie logiciel au traitement de données capteurs multimodales, Bagzel rend viable l'exploration rapide de paramètres de preprocessing, le débogage de pipelines de perception, et la maintenance de datasets versionnés de manière déterministe. Pour un intégrateur ou une équipe de recherche manipulant régulièrement des dizaines de gigaoctets de données capteurs, réduire le temps de rebuild d'un facteur plusieurs centaines change concrètement le rythme d'expérimentation. Le format ROS bag reste le standard de facto pour l'enregistrement de données capteurs (lidar, caméra, IMU) en conditions réelles, tant en recherche qu'en industrie, mais sa conversion vers des formats ML exploitables est généralement assurée par des scripts maison non maintenables. Bagzel s'inscrit dans une tendance de professionnalisation du MLOps en robotique, un espace où des outils comme DVC ou Foxglove Studio couvrent des parties du problème sans offrir la cohérence d'un système de build unifié. Le laboratoire TAS de l'UniBwM est actif sur les thématiques de conduite autonome et de perception embarquée. Les prochaines étapes naturelles pour Bagzel concernent l'intégration avec des pipelines d'entraînement continu et l'extension à d'autres formats standardisés comme le Waymo Open Dataset.

UEL'outil est développé par l'Université de la Bundeswehr Munich (Allemagne/UE), renforçant l'outillage MLOps open source européen pour les équipes de robotique et de conduite autonome manipulant des données capteurs ROS.

InfrastructureOpinion
1 source
NVIDIA Jetson amène l'IA à base d'agents dans le monde physique
3NVIDIA Blog Robotics 

NVIDIA Jetson amène l'IA à base d'agents dans le monde physique

Lors du salon COMPUTEX à Taipei le 27 mai 2026, NVIDIA a annoncé JetPack 7.2 et le support de NemoClaw sur la plateforme Jetson, marquant une étape concrète dans le déploiement de l'IA agentique sur des systèmes embarqués physiques. JetPack 7.2 apporte le support du projet Yocto pour une distribution Linux allégée et personnalisable, CUDA 13 sur Jetson Orin, et le support MIG (Multi-Instance GPU) couplé à un noyau temps réel sur Jetson Thor, permettant de réserver des ressources GPU dédiées à des tâches déterministes comme la perception robotique. Le module Jetson AGX Orin 32 Go gagne également 20 % de performances, atteignant 241 TOPS d'inférence IA. NemoClaw, le framework agentique de NVIDIA, se déploie désormais sur Jetson en une seule commande. Deux partenaires sont déjà en production : Solomon, qui utilise NemoClaw pour coordonner raisonnement, perception, fusion de capteurs, locomotion et manipulation sur un robot humanoïde, et Advantech, qui déploie un "cerveau d'usine agentique" dans ses propres lignes de fabrication en combinant NemoClaw, Nemotron 3 et Jetson Thor pour la gestion de flottes robotiques et l'inspection de défauts. L'importance de cette annonce réside dans le passage de l'IA agentique des serveurs vers les systèmes embarqués en production industrielle, un écart que l'industrie peinait à combler. L'architecture en trois couches proposée, OS + compute en base (JetPack), skills d'automatisation développeur au milieu, et NemoClaw en orchestrateur applicatif au sommet, permet aux intégrateurs de construire des workflows agentiques complets sans infrastructure cloud. Pour un COO industriel ou un ingénieur robotique, le gain annoncé est celui du time-to-market : des tâches de déploiement et de configuration qui prenaient plusieurs semaines peuvent désormais être réduites à quelques jours grâce aux agent skills dérivées de la documentation officielle NVIDIA. Le support MIG sur Thor est particulièrement significatif pour les applications robotiques réelles, où l'inférence temps réel ne peut pas être interrompue par des tâches d'IA concurrentes. Il faut toutefois noter que les chiffres de performance et les gains de productivité annoncés proviennent du communiqué de presse NVIDIA lui-même, sans benchmark indépendant disponible à ce stade. La plateforme Jetson est déjà déployée dans des secteurs variés, notamment la robotique industrielle, les drones, les dispositifs médicaux, les machines agricoles et les systèmes humanoïdes, et constitue depuis plusieurs générations, Orin puis Thor, l'un des compute modules embarqués les plus répandus dans l'industrie. NemoClaw s'inscrit dans la stratégie d'NVIDIA de descendre son stack agentique, initialement développé pour les serveurs DGX, vers l'edge et les systèmes physiques autonomes. Sur le plan concurrentiel, cette annonce positionne NVIDIA face à des alternatives edge comme Qualcomm (RB5/RB6 pour la robotique) et Google Coral, mais aussi face aux SOC propriétaires développés par Boston Dynamics, Figure ou 1X pour leurs propres humanoïdes. Les prochaines étapes annoncées incluent l'extension des Metropolis VSS blueprint skills pour l'interprétation visuelle agentique, et la diffusion de l'événement Build-a-Claw à Taiwan, signe que NVIDIA cherche à ancrer son écosystème développeur en Asie du Sud-Est, région clé pour la fabrication électronique et robotique mondiale.

UELes intégrateurs robotiques européens sur Jetson Orin/Thor peuvent déployer des workflows agentiques complets sans cloud, réduisant potentiellement le time-to-market de plusieurs semaines à quelques jours, gain concret pour l'automatisation industrielle EU, sans validation indépendante à ce stade.

InfrastructureOpinion
1 source
Déployer une IA à base d'agents en périphérie avec efficacité mémoire grâce à NVIDIA JetPack 7.2
4NVIDIA Developer Blog 

Déployer une IA à base d'agents en périphérie avec efficacité mémoire grâce à NVIDIA JetPack 7.2

NVIDIA a publié JetPack 7.2, une mise à jour de sa suite logicielle pour les modules Jetson, ciblant le déploiement d'agents IA en périphérie (edge computing). La nouveauté centrale est le support natif en une seule commande de NemoClaw, une stack open source qui étend OpenClaw en y ajoutant des couches de contrôle de confidentialité et de sécurité. La version introduit également des "agent skills" pour Jetson, des briques logicielles pré-packagées conçues pour accélérer le développement d'agents autonomes sur matériel embarqué, accompagnées d'optimisations mémoire visant à améliorer les performances dans des configurations à ressources contraintes. Le passage des agents IA vers des environnements physiques impose des contraintes radicalement différentes du cloud : latence faible, connectivité intermittente et enveloppes mémoire restreintes. L'intégration native de NemoClaw dans JetPack 7.2 positionne Jetson comme plateforme de référence pour des agents embarqués avec garanties explicites de sécurité et de confidentialité des données, un argument commercial décisif pour les déploiements industriels, médicaux ou logistiques où les données sensibles ne peuvent quitter le site. Pour les intégrateurs, la simplification à une seule commande réduit significativement la friction d'adoption. NVIDIA commercialise les modules Jetson depuis 2014 et JetPack 7.2 s'inscrit dans sa stratégie de déport progressif de l'inférence IA hors du datacenter. OpenClaw, sur lequel NemoClaw s'appuie, est l'environnement d'exécution agent de NVIDIA pour l'edge. Les concurrents directs sur ce segment incluent Qualcomm avec son AI Hub et son Robotics SDK, ainsi que Hailo, Google Coral et Kneron. L'annonce reste au stade de disponibilité logicielle : aucun chiffre de volume de déploiement ni timeline client n'a été communiqué.

UELes intégrateurs européens déployant des agents IA embarqués sur Jetson dans des contextes industriels, médicaux ou logistiques bénéficient d'une simplification d'adoption et de garanties de confidentialité des données conformes aux exigences réglementaires locales (RGPD, AI Act).

InfrastructureOpinion
1 source
NVIDIA publie de nouveaux outils et des mises à jour pour les développeurs d'IA physique
5The Robot Report 

NVIDIA publie de nouveaux outils et des mises à jour pour les développeurs d'IA physique

Lors du GTC Taipei et du Computex, NVIDIA a dévoilé un ensemble de nouveaux outils open-source rassemblés sous le nom NVIDIA Agent Toolkit, destinés aux développeurs de systèmes d'IA physique : robotique, véhicules autonomes, vision industrielle et jumeaux numériques. L'objectif affiché est de réduire le coût et la complexité des pipelines de développement en rendant l'ensemble de la pile logicielle de NVIDIA directement orchestrable par des agents IA. Les outils concernés incluent Cosmos 3, le modèle de fondation pour la compréhension du monde physique (vidéo, texte, prédiction d'états futurs), les bibliothèques Omniverse pour la simulation et les jumeaux numériques, Isaac pour la robotique, Metropolis pour la vision IA, Alpamayo pour la conduite autonome, et la plateforme Jetson pour le déploiement embarqué. Le déploiement sécurisé de ces agents est encadré par le blueprint NemoClaw et le runtime OpenShell, qui appliquent des politiques de sécurité et de confidentialité en local comme dans le cloud. L'approche "agent-ready" de NVIDIA marque un changement de paradigme dans le développement de l'IA physique : plutôt que des bibliothèques que les ingénieurs assemblent manuellement, les outils deviennent des briques directement appelables par des agents de codage, capables d'enchaîner automatiquement génération de données, simulation, entraînement et évaluation. Pour les développeurs de véhicules autonomes, cela signifie qu'un agent peut reconstruire des scènes à partir de données de flotte, générer des scénarios de conduite photoréalistes et lancer des boucles de renforcement sans intervention manuelle à chaque étape. Pour les intégrateurs robotiques, des tâches comme l'automatisation de l'entraînement à la navigation ou le tuning de systèmes Jetson deviennent théoriquement scriptables. Rev Lebaredian, vice-président pour la simulation d'IA physique chez NVIDIA, a qualifié Cosmos 3 de "modèle de fondation frontier pour l'IA physique", capable de comprendre vidéo et texte, de prédire les états futurs et de générer des actions, positionnant ce world model comme un candidat généraliste opérationnel, même si aucune métrique de benchmark indépendante n'a été communiquée à ce stade. NVIDIA consolide avec cette annonce sa position d'infrastructure de référence pour l'IA physique, un rôle qu'elle occupe via ses GPU d'entraînement et ses plateformes Isaac Sim et Jetson. La compétition dans ce segment s'intensifie : Google DeepMind pousse MuJoCo et ses dérivés, Boston Dynamics, Figure, Agility Robotics et Physical Intelligence développent leurs propres stacks de simulation et d'apprentissage, tandis que des acteurs industriels comme Siemens ou ANSYS occupent le terrain des jumeaux numériques. En Europe, des entreprises comme Wandercraft ou Enchanted Tools pourraient bénéficier de ces outils si la promesse de réduction de complexité se confirme en pratique. NVIDIA joue ici la carte de la plateforme unifiée plutôt que du modèle de fondation isolé, un positionnement cohérent avec son modèle d'affaires mais qui reste à valider au-delà des démonstrations internes. Les suites annoncées incluent des applications en santé, dont le détail n'a pas été entièrement communiqué lors de l'événement.

UELes entreprises françaises comme Wandercraft et Enchanted Tools pourraient bénéficier de la réduction de complexité annoncée, mais aucun déploiement européen concret n'est confirmé à ce stade.

InfrastructureOpinion
1 source
Nouvelle antenne de 10 watts permet aux robots sous-marins de communiquer à 700 mètres de profondeur
6Interesting Engineering 

Nouvelle antenne de 10 watts permet aux robots sous-marins de communiquer à 700 mètres de profondeur

Des chercheurs de l'Université de Floride ont publié dans l'IEEE Journal of Oceanic Engineering les résultats de BlueME, un système d'antennes magnétoélectriques compactes conçu pour la communication entre robots sous-marins autonomes. Le système consomme au maximum 10 watts, moins qu'un système de caméra stéréo standard, tout en maintenant des liaisons de données stables entre deux AUV (véhicules sous-marins autonomes) séparés par plus de 700 mètres. Il émet des signaux électromagnétiques à très basse fréquence (VLF) et basse fréquence (LF) en exploitant la résonance mécanique naturelle d'un réseau d'éléments magnétoélectriques qui vibrent pour générer le signal, plutôt que de forcer une transmission brute à travers le milieu aquatique. Le projet est piloté par le Dr Md Jahidul Islam, spécialiste de la robotique marine, en collaboration avec le Dr Adam Khalifa, dont les recherches portent habituellement sur les implants médicaux sans fil miniaturisés, une combinaison interdisciplinaire qui a directement inspiré l'approche technique. L'enjeu est considérable pour les opérations multi-AUV actuelles : faute de canal de communication suffisant, les drones sous-marins ne peuvent échanger que des informations rudimentaires, et toute mise à jour de mission ou transmission de données complexes oblige les engins à remonter en surface, interrompant les opérations et allongeant massivement les cycles. BlueME cherche à combler ce vide en proposant une liaison robuste là où les technologies acoustiques (sonar) souffrent des échos et de la turbidité, et où les communications optiques laser sont bloquées par les particules en suspension. Les 10 watts affichés sont une métrique utile, mais les conditions réelles de test (profondeur, salinité, configurations multi-antennes) ne sont pas encore entièrement documentées dans les communiqués disponibles, un point à suivre lors des prochaines publications. Si les performances se confirment en déploiement réel, les intégrateurs de systèmes offshore et les opérateurs de surveillance environnementale disposeraient d'un outil permettant, selon les termes d'Islam, qu'un robot "ping" l'opérateur toutes les dix minutes pour permettre des décisions en temps réel sans interrompre la mission. L'idée centrale est née d'une analogie inattendue : le corps humain est lui-même constitué d'eau légèrement salée, un environnement que Khalifa a passé des années à traverser avec des signaux sans fil pour ses implants. Cette convergence disciplinaire a conduit l'équipe à réexaminer les contraintes physiques de la propagation sous-marine depuis une perspective biomédicale. Le brevet provisoire a été déposé et l'équipe recherche activement des partenariats industriels pour passer du prototype à l'intégration sur des sous-marins autonomes commerciaux. Dans le paysage concurrentiel, BlueME se positionne face aux systèmes de modems acoustiques (WaterLinked, EvoLogics) et aux communications optiques sous-marines (Sonardyne BlueComm), en promettant une immunité aux perturbations sédimentaires que ces deux approches ne peuvent garantir. Les prochaines étapes annoncées portent sur le financement, la montée en échelle du prototype et les premiers essais sur plateformes commerciales.

UELa technologie BlueME représente une concurrence potentielle pour EvoLogics (Allemagne) et Sonardyne (Royaume-Uni), acteurs européens des communications acoustiques sous-marines pour AUV.

InfrastructurePaper
1 source
Les logiciels deviennent le principal frein à l'innovation en IA physique, selon une étude QNX
7Robotics Business Review 

Les logiciels deviennent le principal frein à l'innovation en IA physique, selon une étude QNX

Lors du Robotics Summit & Expo de Boston, QNX, division de BlackBerry Ltd., a publié les résultats de son étude "Inside the Robot: Architecture Benchmark Report", menée entre février 2025 et avril 2026 auprès de 1 000 développeurs et ingénieurs logiciels travaillant en robotique. Le constat central est statistiquement net : 27 % des répondants identifient l'architecture logicielle et l'intégration comme leur principal goulot d'étranglement de performance, contre seulement 16 % qui pointent le matériel. 83 % des équipes interrogées déclarent que leurs systèmes opèrent déjà aux côtés d'humains, dans des environnements aussi variés que des blocs opératoires ou des entrepôts actifs. 85 % anticipent que le logiciel jouera un rôle encore plus déterminant dans les trois à cinq prochaines années, et les investissements prioritaires déclarés convergent vers l'IA décisionnelle et la cybersécurité (51 % chacun), suivis des systèmes d'exploitation et du contrôle temps réel (37 %). Fait notable : 95 % des développeurs affirment que l'exécution déterministe et temps réel est une exigence critique pour leurs systèmes. Ce renversement de priorité, du matériel vers le logiciel, n'est pas anodin pour les intégrateurs et les décideurs industriels. Pendant des décennies, la robotique butait sur des contraintes mécaniques et énergétiques. Le signal envoyé ici est que la limite structurante est désormais la capacité à faire cohabiter, dans une même architecture logicielle, des niveaux de criticité hétérogènes : boucles de sécurité fonctionnelle temps réel, couches IA adaptatives, et exigences de certification (notamment IEC 61508 ou ISO 26262 pour les environnements à risque). Le déploiement de robots dans des environnements non contrôlés, rues, hôpitaux, ateliers mixtes, exige un comportement prédictible dans des conditions que les simulateurs ne couvrent pas entièrement. Les retards de certification cités comme frein majeur suggèrent que le "sim-to-real gap" logiciel est aujourd'hui aussi structurant que le gap physique, un point que les équipes focalisées sur les performances des modèles VLA (vision-language-action) auraient intérêt à intégrer. QNX opère sur ce marché depuis les années 1980 avec son OS temps réel, historiquement dominant dans l'automobile et le médical. Le rapport s'inscrit dans un repositionnement stratégique de BlackBerry sur la robotique collaborative et les systèmes embarqués critiques, face à une concurrence qui inclut des solutions open-source comme ROS 2 couplé à des RTOS (Linux RT, Zephyr), ainsi que des stacks propriétaires développés en interne par des acteurs comme Boston Dynamics ou Intrinsic (Alphabet). L'étude ne couvre pas les timelines de déploiement produit ni les résultats quantitatifs sur des systèmes réels, ce qui lui confère davantage la valeur d'un état des lieux de perception industrielle que d'un benchmark technique au sens strict. Les prochains trimestres verront si QNX traduit ces signaux en offres logicielles concrètes adaptées aux architectures hybrides CPU/NPU qui équipent les humanoïdes et les AMR de nouvelle génération.

InfrastructureOpinion
1 source
NIST propose un benchmark de référence pour évaluer les performances des robots humanoïdes
8The Robot Report 

NIST propose un benchmark de référence pour évaluer les performances des robots humanoïdes

Le National Institute of Standards and Technology (NIST) a publié en avril 2026 une proposition de référentiel de performance standardisé pour les robots humanoïdes, décrit comme un ensemble de tâches de locomotion et de manipulation à faible empreinte logistique. C'est le premier cadre d'évaluation de ce type depuis le DARPA Robotics Challenge de 2015, selon Aaron Prather, directeur du programme Robotics & Autonomous Systems chez ASTM International. Le benchmark couvre quatre dimensions : la mobilité de base (agnostic au domaine d'application), la manipulation et la dextérité, les capacités combinées loco-manipulation, le contrôle en espace contraint, et un niveau minimal de raisonnement et de compréhension de scène. Le NIST prévoit de fabriquer un nombre limité d'appareils de test physiques pour les distribuer gratuitement aux fabricants américains d'humanoïdes et aux centres de test régionaux, et de publier les plans et modèles 3D pour usage en environnement physique ou virtuel (simulateurs de training et de développement de contrôle). Les données collectées seront agrégées sous des accords de partage préapprouvés protégeant la propriété intellectuelle. L'absence de standard commun est un problème structurel pour le secteur : Tesla Optimus, Figure, Agility Robotics, Apptronik, Unitree et une douzaine d'autres plateformes humanoïdes ont attiré des milliards de dollars d'investissement ces dix dernières années sans qu'il existe de méthode consensuelle pour mesurer ce qu'elles font réellement. Comme le note Prather, "les vidéos marketing ont comblé le vide". Pour un intégrateur industriel ou un décideur B2B, l'absence de benchmarks opposables rend toute comparaison entre plateformes impossible et ralentit les décisions d'achat. Ce référentiel, s'il est adopté, permettrait d'objectiver le fossé entre démo et déploiement réel, de quantifier les progrès en loco-manipulation et en whole-body control, et d'offrir aux chercheurs une baseline reproductible. Il représente aussi un signal réglementaire potentiel : un benchmark NIST peut devenir une norme de fait pour les appels d'offres gouvernementaux américains. Ce projet s'appuie sur la collaboration antérieure du NIST avec le DARPA pour évaluer les capacités humanoïdes dans l'industrie et la recherche académique. En Europe, le Fraunhofer IPA (Stuttgart) a publié ce mois-ci son propre référentiel de sécurité et de développement pour humanoïdes, structuré autour de six critères, signalant que la course aux standards est désormais transatlantique. Aucun acteur français ou européen n'est directement impliqué dans la proposition NIST à ce stade, bien que des entreprises comme Enchanted Tools ou Wandercraft pourraient être concernées si ce cadre influence les standards ISO ou CEN. Le NIST est en phase de consultation et recherche des participants, fabricants comme labos, pour affiner la liste des tâches et tester leurs robots dans les installations NIST ou partenaires. Aucune date de finalisation n'est annoncée.

UELe Fraunhofer IPA a publié ce même mois son propre référentiel de sécurité pour humanoïdes, signalant une course transatlantique aux standards ; si le benchmark NIST influence les normes ISO/CEN, des acteurs européens comme Enchanted Tools ou Wandercraft devront adapter leur processus de qualification.

InfrastructureOpinion
1 source
Une architecture hétérogène pour l'apprentissage par renforcement robotique au-delà des paradigmes dominés par les GPU
9arXiv cs.RO 

Une architecture hétérogène pour l'apprentissage par renforcement robotique au-delà des paradigmes dominés par les GPU

Une équipe de chercheurs a publié le 29 mai 2026 UniLab, un système d'entraînement pour le reinforcement learning (RL) robotique qui repose sur une architecture hétérogène : simulation physique sur CPU en parallèle, apprentissage de politique sur GPU. Contrairement aux pipelines dominants qui concentrent physique, collecte de trajectoires et optimisation sur un unique chemin GPU (approche popularisée par Isaac Gym, IsaacLab ou Genesis), UniLab dissocie ces deux phases via un runtime unifié gérant le transfert de données, le buffering et la synchronisation entre unités de calcul. Le système intègre deux backends physiques CPU-batched, MuJoCoUni et MotrixSim, et supporte cinq algorithmes d'entraînement standards : PPO, SAC, FlashSAC, TD3 et APPO. Sur des tâches de contrôle robotique représentatives, l'architecture affiche un gain de 3 à 10x sur l'efficacité d'entraînement bout-en-bout, à configuration matérielle équivalente. Fait notable : UniLab fonctionne hors de l'écosystème CUDA, avec support explicite de macOS, AMD ROCm et Intel XPU. Ce résultat remet en question une hypothèse structurante du champ depuis trois à quatre ans : que la performance en RL sim-to-real exige que la physique tourne sur GPU pour atteindre un débit suffisant. UniLab démontre empiriquement que le goulot d'étranglement n'est pas le processeur qui exécute la physique, mais la qualité du pipeline de synchronisation entre simulation et apprentissage. Pour les équipes robotique industrielles ou académiques qui ne disposent pas de clusters NVIDIA haut de gamme, cette architecture ouvre des alternatives concrètes, notamment sur Apple Silicon ou sur des accélérateurs AMD/Intel disponibles dans les clouds alternatifs, souvent moins chers. C'est aussi un signal pour les intégrateurs qui déploient des systèmes de sim-to-real en production : la dépendance à CUDA n'est pas une fatalité technique, mais un choix d'architecture. Le débat GPU vs CPU pour la simulation physique en RL robotique n'est pas nouveau, mais il s'était largement tranché en faveur du GPU depuis les travaux d'Isaac Gym (NVIDIA, 2021) et leurs successeurs. La majorité des frameworks modernes, IsaacLab, ManiSkill, Genesis, optimisent autour de ce paradigme. UniLab se positionne explicitement comme une alternative portable et extensible, en s'appuyant sur MuJoCo (DeepMind/Google), devenu le simulateur de référence académique depuis son passage open source en 2021. Le code est disponible publiquement sur GitHub (unilabsim/UniLab). Les prochaines étapes probables concernent la validation sur des tâches de locomotion bipède et de manipulation dextère, qui constituent les benchmarks décisifs pour évaluer si le gain de 3-10x se maintient sur des environnements physiquement plus complexes et des horizons de simulation plus longs.

UELes équipes de recherche et industrielles européennes en robotique qui ne disposent pas de clusters NVIDIA haut de gamme peuvent désormais envisager des pipelines sim-to-real compétitifs sur hardware AMD ROCm, Intel XPU ou Apple Silicon, réduisant leur dépendance à l'écosystème CUDA et aux coûts associés.

InfrastructureOpinion
1 source
Sortie de l'Open Motion Planning Library 2.0
10arXiv cs.RO 

Sortie de l'Open Motion Planning Library 2.0

L'Open Motion Planning Library (OMPL), publiée en open source en 2008, franchit en mai 2026 une étape majeure avec la sortie d'OMPL 2.0, annoncée via un preprint arXiv (2605.29301). Cette mise à jour de fond fait évoluer une bibliothèque de planification de mouvement par échantillonnage qui, en près de deux décennies de développement continu, avait déjà intégré des planificateurs asymptotiquement optimaux, des planificateurs paresseux (lazy planners), la planification sous contraintes, et la planification avec objectifs en logique temporelle. La version 2.0 cible explicitement la planification de mouvement en temps réel grâce à l'accélération matérielle (GPU/FPGA), et s'interface avec les workflows de recherche en IA modernes. Aucun benchmark quantitatif n'est publié dans le résumé; les détails de performance restent à évaluer à la lecture du papier complet. L'enjeu est direct pour les équipes de robotique intégrées dans des environnements industriels ou académiques : OMPL est aujourd'hui l'une des briques les plus utilisées dans ROS/ROS 2 via MoveIt, ce qui signifie qu'une accélération matérielle en production peut réduire les temps de calcul de trajectoire de plusieurs ordres de grandeur, condition sine qua non pour les bras manipulateurs collaboratifs, les humanoïdes en manipulation dextère, et les AMR opérant dans des espaces non structurés. L'intégration avec les pipelines IA modernes, typiquement Vision-Language-Action (VLA) ou apprentissage par imitation, répond à un verrou réel : les planificateurs classiques et les modèles neuronaux cohabitent encore difficilement en temps réel. OMPL a été développé initialement à Rice University sous l'impulsion de Ioan Sucan et Lydia Kavraki, puis maintenu par une communauté large incluant des contributions de Willow Garage, puis de MoveIt. Ses concurrents directs dans l'écosystème open source incluent DRAKE (Toyota Research Institute / MIT), Tesseract (ROS-Industrial), et Pinocchio côté cinématique. Côté européen, des acteurs comme Wandercraft (exosquelette) ou Enchanted Tools (Mirmi) s'appuient sur des couches de planification proches. La prochaine étape naturelle sera la validation sur benchmarks standardisés (MotionBenchMaker, PlanningBenchmark) et l'intégration officielle dans MoveIt 2; aucune timeline n'est encore communiquée.

UEWandercraft et Enchanted Tools (Mirmi), acteurs français s'appuyant sur des couches de planification proches d'OMPL via ROS/MoveIt, pourraient bénéficier de l'accélération GPU/FPGA d'OMPL 2.0 pour réduire les temps de calcul de trajectoire en production.

InfrastructureOpinion
1 source
ICAN-Deploy : déploiement canari à identité stable pour agents incarnés en environnements critiques
11arXiv cs.RO 

ICAN-Deploy : déploiement canari à identité stable pour agents incarnés en environnements critiques

Des chercheurs présentent ICAN-Deploy (Identity-stable CANary Deployment), un middleware conçu pour faire évoluer le logiciel de robots certifiés sans invalider leur certification. Le principe du déploiement canary, router une fraction du trafic vers une nouvelle version, surveiller des métriques, puis rollback si régression, est standard en DevOps cloud. Problème : les contrôleurs du marché, Argo Rollouts, Spinnaker et Flagger, modifient l'identité cryptographique du système durant la fenêtre de transition. Ce drift est inoffensif pour des microservices sans état, mais rompt pour les robots l'assurance réglementaire centrale : "l'agent certifié est l'agent déployé". ICAN-Deploy sépare les noms de capacités, figés et hachés dans le manifeste, des versions de capacités, un état runtime mutable, maintenant ainsi le hash d'identité invariant tout au long du cycle. Les auteurs valident l'invariance par preuve formelle, lint AST et model-checking TLA+, puis corroborent sur N=100 cycles canary dans un environnement MuJoCo simulant un bras Franka Panda : zéro drift observé, latence d'entrée 95% BCa CI [1,52 ; 2,01] ms. L'enjeu est structurel pour l'industrie. Dans les secteurs à certification obligatoire (médical, aérospatial, industrie lourde), chaque mise à jour logicielle d'un robot peut déclencher un cycle de revalidation de plusieurs semaines. ICAN-Deploy renverse la logique : certifier une architecture de déploiement plutôt que chaque version individuelle. Un système certifié une fois peut ensuite évoluer librement dans l'enveloppe nom-version définie, sans recertification formelle. C'est un déblocage potentiel pour le continuous delivery sur robots en environnement de production. Le "strawman" alternatif testé, qui incorpore les versions dans le manifeste d'identité, échoue systématiquement sur les mêmes workloads, renforçant la valeur de la comparaison. La gestion du cycle de vie logiciel des agents physiques reste un angle mort du secteur robotique. Ce travail s'inscrit dans la tendance émergente du "runtime governance" pour LLMs et agents incarnés, cherchant à réconcilier l'agilité du software moderne et les contraintes de sûreté des systèmes physiques. Le Franka Panda, standard de fait en recherche sur la manipulation depuis le rachat d'Emika GmbH par Agile Robots, facilite la reproductibilité des résultats. Le papier est un preprint arXiv (arXiv:2605.28097v1), non encore peer-reviewed, et les métriques restent à confirmer sur hardware réel hors simulation. Les étapes naturelles : intégration dans ROS 2 ou OpenRMF, et validation du modèle "certifier l'architecture, pas la version" par des organismes de certification sectoriels.

UEL'approche pourrait alléger les cycles de recertification imposés aux robots opérant dans les secteurs réglementés européens (médical, aérospatial, machinerie) au regard de la Directive Machines et des dispositions à hauts risques du règlement IA.

InfrastructureOpinion
1 source
EtherCAT pour le contrôle des articulations de robots : les explications de GigaDevice
12Pandaily 

EtherCAT pour le contrôle des articulations de robots : les explications de GigaDevice

GigaDevice a organisé un webinaire intitulé "Secure Robotics in Motion" pour exposer la direction prise par les systèmes de contrôle robotique modernes, avec un focus sur EtherCAT, le protocole de communication temps réel déterministe qui s'impose dans la synchronisation des articulations multi-axes. Une main dextre de robot humanoïde intègre typiquement 10 à 20 degrés de liberté (DOF), chacun adossé à un moteur, une suite de capteurs, un algorithme de contrôle et un lien de communication devant délivrer les données à la microseconde près. EtherCAT répond à ce défi via une architecture maître-esclave où chaque nœud traite les données à la volée, atteignant des temps de cycle de 20 à 250 microsecondes avec une gigue inférieure à 1 microseconde. Les horloges distribuées garantissent une référence temporelle commune à tous les axes, évitant les désynchronisations qui rendraient tout mouvement coordonné impossible. Pour adresser ce marché directement, GigaDevice a présenté sa série GD32H75E : un microcontrôleur Cortex-M7 cadencé jusqu'à 600 MHz, avec DSP, FPU double précision et MPU, intégrant un contrôleur esclave EtherCAT plus deux PHYs sur un même die. Le chip embarque également une unité mathématique trigonométrique (TMU), des filtres FIR/IIR, un filtre numérique haute performance (HPDF), une sortie de division de fréquence d'encodeur (EDOUT), et un ensemble de fonctions sécurité : AES, SHA, HMAC, EFUSE, TRNG et démarrage sécurisé. L'intégration du contrôleur EtherCAT directement dans le MCU réduit le nombre de composants externes, simplifie le routage des cartes et abaisse la consommation système, ce qui représente un avantage mesurable pour les intégrateurs qui conçoivent des articulations compactes. Plus structurellement, la présence de fonctions de sécurité matérielles signale un changement dans la perception du marché : les robots ne sont plus des systèmes isolés mais des noeuds réseau exposés dans des usines, entrepôts et environnements domestiques. Le fait qu'un fournisseur de microcontrôleurs grand public comme GigaDevice propose désormais un SoC dédié à ce cas d'usage indique que la demande en volume commence à justifier du silicium spécialisé, au-delà des solutions FPGA ou des stacks logiciels ajoutés sur des MCUs génériques. GigaDevice, fondé en 2005 à Pékin et coté à Shanghai, s'est imposé sur le marché des microcontrôleurs GD32 en concurrence directe avec STMicroelectronics, NXP, Renesas et Texas Instruments. EtherCAT a été développé par Beckhoff Automation dans les années 2000 et reste géré par l'ETG (EtherCAT Technology Group), qui compte aujourd'hui plus de 7 500 membres. Dans l'espace des contrôleurs EtherCAT dédiés, GigaDevice se positionne face à Hilscher, Microchip (LAN9252) et Beckhoff lui-même. Le webinaire ne s'accompagne pas d'annonces de déploiements clients ni de volumes de production, ce qui en fait davantage une communication de positionnement produit qu'un retour terrain. La prochaine étape observable sera la présence de la série GD32H75E dans des kits d'articulations humanoïdes ou des drives de servomoteurs commerciaux.

UELa montée en puissance de GigaDevice sur le segment des MCUs robotiques représente une pression concurrentielle directe sur STMicroelectronics, acteur franco-italien explicitement cité comme concurrent direct dans ce marché des microcontrôleurs industriels.

InfrastructureActu
1 source
Les humanoïdes apprennent à lire les situations
13Robotics Business Review 

Les humanoïdes apprennent à lire les situations

Concevoir un robot humanoïde capable d'opérer en sécurité aux côtés d'humains mobilise aujourd'hui une chaîne complète de technologies de perception en temps réel. Analog Devices Inc. (ADI) détaille dans un article technique les briques nécessaires à cette conscience situationnelle, porté par Geir Ostrem, Fellow ADI au sein de l'unité Automotive. Le défi central est architectural : capteurs visuels et microphones sont physiquement éloignés du processeur principal, ce qui introduit de la latence sur des câbles longs. Pour y répondre, ADI adapte sa technologie GMSL (Gigabit Multimedia Serial Link), déjà standardisée en automobile, aux châssis humanoïdes. GMSL transporte de la vidéo en flux unique à plusieurs gigabits par seconde, permettant un traitement local embarqué (via ce qu'ADI appelle "physical AI") plutôt qu'un renvoi vers le cloud. Sur la partie vision, les méthodes évoquées sont connues : capteurs RGB, time-of-flight, lumière structurée et stéréovision pour la profondeur. Sur la partie audio, la problématique est similaire : il faut une latence déterministe entre les microphones et l'ordinateur central pour localiser et identifier des événements sonores, par exemple un objet qui tombe derrière le robot. Des processeurs secondaires, positionnés au plus près des capteurs ou des actionneurs, gèrent les boucles de contrôle rapides et transmettent en parallèle au processeur principal. Ce que cette publication illustre concrètement, c'est le déplacement du centre de gravité technologique dans la robotique humanoïde : la mécanique et les modèles de mouvement ne suffisent plus, c'est la couche de perception embarquée qui devient le facteur limitant pour un déploiement en environnement mixte. La latence n'est pas un détail d'ingénierie, c'est une contrainte de sécurité. Un humanoïde qui réagit avec 200 ms de délai à un collègue qui change de trajectoire n'est pas exploitable en production. Le passage au traitement local, sans dépendance réseau, est donc moins un choix de performance qu'une nécessité opérationnelle, surtout dans des ateliers ou entrepôts où la connectivité peut être dégradée. L'article confirme ce que les intégrateurs industriels observent terrain : les architectures distribuées, avec des processeurs locaux près des actionneurs, deviennent le standard de facto pour les boucles de contrôle à haute fréquence. ADI arrive dans la robotique humanoïde depuis l'automobile, où GMSL équipe déjà les systèmes ADAS de nombreux constructeurs. Ce repositionnement sectoriel est cohérent avec la dynamique du marché : la pénurie de main-d'oeuvre pousse à l'accélération des déploiements en espaces partagés, et les fabricants d'humanoïdes, de Figure à Tesla Optimus en passant par Agility Robotics ou 1X Technologies, ont tous besoin de sous-systèmes de perception matures et validés industriellement. À noter que cet article est un contenu sponsorisé signé ADI, ce qui tempère son caractère neutre : les métriques citées (débit GMSL, latence) sont présentées sans benchmark comparatif ni conditions de test précisées. Les prochaines étapes probables pour ADI consistent à nouer des partenariats OEM directs avec des constructeurs d'humanoïdes, une dynamique déjà visible chez des fournisseurs de composants comme NVIDIA (plateforme Thor/Jetson) ou Bosch, qui ciblent eux aussi ce segment en pleine structuration.

InfrastructureActu
1 source
GMSL et l'écosystème croissant autour des systèmes de vision robotique
14Robotics Business Review 

GMSL et l'écosystème croissant autour des systèmes de vision robotique

Le standard GMSL (Gigabit Multimedia Serial Link), longtemps cantonné aux systèmes embarqués automobiles, s'impose progressivement comme interface de référence pour les architectures de vision multi-caméra en robotique. Stephen Liu, responsable robotique chez Advantech, développeur de systèmes embarqués, estime qu'environ un tiers des projets robotiques qu'il accompagne intègrent ou évaluent déjà des caméras GMSL. La technologie est désormais déployée en production, au-delà du stade POC, dans des robots mobiles autonomes (AMR) d'entrepôt, des stations de picking et des robots humanoïdes, avec une adoption croissante en agriculture, santé et construction. Le principe : transporter flux vidéo haute résolution, signaux de contrôle et synchronisation sur un seul câble léger, avec une latence déterministe et une résistance aux perturbations électromagnétiques (EMI). Le défi que résout le GMSL n'est plus simplement la qualité d'image, mais l'orchestration système. Dans un robot équipé de plusieurs caméras, d'un lidar et d'une IMU, même quelques millisecondes de dérive entre capteurs suffisent à dégrader la précision de navigation. Gérer simultanément la bande passante, la latence, la synchronisation matérielle et le calcul embarqué (GPU, MPU, RTOS temps réel) est une contrainte qui bloque de nombreux projets en phase d'intégration. En milieu industriel difficile - vibrations, poussière, eau, températures extrêmes - les problèmes s'amplifient : les câbles longs exposent les connecteurs aux contraintes mécaniques et aux interférences ESD. Le GMSL apporte une réponse éprouvée : synchronisation hardware précise, câblage simplifié, robustesse démontrée à l'échelle. Pour les OEM robotiques, l'enjeu est autant économique que technique : réduire les mois d'intégration bas niveau pour se concentrer sur la différenciation réelle - modèles d'IA, logique applicative, déploiement. La trajectoire du GMSL est directement héritée de l'ADAS automotive et des systèmes de conduite autonome, secteurs qui ont résolu en premier les mêmes contraintes : caméras multiples synchronisées, longs filaires, conditions sévères. Analog Devices Inc. (ADI), qui sponsorise cet article, a construit un écosystème GMSL comprenant modules caméra pré-validés, adaptateurs, BSP et plateformes compatibles ROS, avec pour objectif affiché de raccourcir le chemin du prototype à la production. Cette origine éditoriale oriente naturellement le propos vers les avantages du GMSL sans mise en perspective concurrentielle : d'autres interfaces coexistent, notamment MIPI CSI-2 pour les courtes distances ou Ethernet TSN pour les architectures distribuées. La maturité croissante de l'écosystème GMSL en robotique mobile - notamment pour les humanoïdes et l'agriculture robotisée - laisse anticiper une standardisation plus large dans les prochaines générations de plateformes commerciales.

InfrastructureActu
1 source
DARPA prépare une mission de maintenance satellitaire robotisée pour 2026
15Robotics & Automation News 

DARPA prépare une mission de maintenance satellitaire robotisée pour 2026

La Defense Advanced Research Projects Agency (DARPA) et ses partenaires industriels s'apprêtent à lancer en été 2026 la mission RSGS (Robotic Servicing of Geosynchronous Satellites), un démonstrateur orbital conçu pour inspecter, réparer et reconfigurer des satellites en orbite géostationnaire (GEO, à environ 35 786 km). Le robot serviceur, développé en partenariat avec Maxar Space, embarque un bras manipulateur multi-degrés-de-liberté équipé d'outils spécialisés capables d'intervenir sur des satellites dits "non coopératifs", c'est-à-dire non conçus a priori pour être réparés en orbite. L'enjeu économique est direct : un satellite GEO commercial représente entre 150 et 400 millions de dollars d'investissement, avec une durée de vie typiquement limitée par l'épuisement du carburant de maintien à poste plutôt que par une défaillance technique. Prolonger ces plateformes de 5 à 10 ans modifie structurellement les modèles économiques des opérateurs (SES, Intelsat, Eutelsat) et réduit la dépendance aux cycles de remplacement coûteux. La mission RSGS cherche aussi à valider des capacités de relocalisation orbitale, ouvrant la voie à des services de "space tug" commerciaux. Le programme RSGS remonte à 2017, date à laquelle DARPA a signé un accord coopératif avec SSL (devenu Maxar Space) après des années de recherche sur la technologie FREND (Front-end Robotics Enabling Near-term Demonstration). Sur ce même créneau, Northrop Grumman a déjà commercialisé son Mission Extension Vehicle (MEV), avec deux satellites Intelsat servis depuis 2020. Astroscale (Japon/UK) et ClearSpace (Suisse, soutenu par l'ESA) progressent sur des segments adjacents. Un succès de RSGS en 2026 légitimerait un marché du "on-orbit servicing" estimé à plusieurs milliards de dollars sur la prochaine décennie.

UEEutelsat (opérateur français) figure parmi les bénéficiaires potentiels directs d'un service de prolongation de vie satellitaire, tandis que ClearSpace (Suisse, soutenu par l'ESA) opère sur un segment adjacent et sera directement impacté par la légitimation ou non du marché 'on-orbit servicing' que validera RSGS en 2026.

InfrastructureOpinion
1 source
Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique
16Pandaily 

Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique

Lightwheel AI, startup pékinoise spécialisée dans l'infrastructure de données et de simulation pour l'IA physique, vient de boucler un nouveau tour de financement dont le montant n'a pas été divulgué. Les fonds seront affectés à trois axes : élargir les capacités de livraison, accélérer l'expansion internationale, et renforcer les partenariats avec des fabricants de robots, des développeurs de véhicules autonomes et des industriels. La société propose un triptyque de services : génération de données d'entraînement synthétiques haute qualité, environnements de simulation pour l'entraînement de modèles, et frameworks d'évaluation et de vérification. Son positionnement repose sur une boucle fermée couvrant la collecte terrain, le développement de simulateurs, l'évaluation et le déploiement en production. La technologie centrale est une approche propriétaire baptisée "calibration sur données réelles + amplification par simulation" : des données capteurs réelles servent de base de calibration, puis la simulation génère des jeux de données synthétiques à grande échelle qui reproduisent les propriétés statistiques du réel tout en étendant la couverture des cas limites et scénarios rares. Ce tour illustre une conviction croissante dans le secteur : avant d'entraîner des robots ou des VLA (Vision-Language-Action models) performants, il faut disposer d'une infrastructure de données robuste et reproductible. La plupart des acteurs de l'IA physique butent aujourd'hui sur le "sim-to-real gap" et sur le coût prohibitif de la collecte de données en environnement réel. Une approche de type "real data calibration + sim amplification" vise précisément à réduire ce coût tout en préservant la validité statistique des données, un défi technique non trivial. Si la méthode s'avère scalable, elle pourrait raccourcir significativement les cycles de développement pour les intégrateurs robotiques et réduire la dépendance aux flottes de collecte physique, aujourd'hui l'un des postes de coût les plus lourds du secteur. Matrix Partners China avait déjà mené le tour Pre-A de Lightwheel en décembre 2023, puis sursouscrit le Pre-A+ suivant, s'établissant comme principal investisseur institutionnel de la société. Ce suivi répété est un signal fort, dans un contexte où l'écosystème de l'IA physique chinois s'organise rapidement autour de couches d'infrastructure distinctes : données, simulation, fondation model, application. Les concurrents directs sur ce segment incluent des acteurs comme Scale AI ou Rendered.ai côté occidental, et plusieurs startups chinoises moins visibles à l'international. Le managing partner Tong Ti a déclaré que 2025-2026 marque "l'année du déploiement à l'échelle" pour l'IA physique, ce qui reste un cadrage marketing à surveiller : le passage de la démonstration au déploiement industriel réel, surtout dans la robotique humanoïde, prend systématiquement plus de temps qu'annoncé. Aucun client nommé, aucun volume de données chiffré, aucun site de déploiement mentionné dans le communiqué, ce qui limite pour l'instant l'évaluation indépendante des affirmations techniques.

InfrastructureActu
1 source
MuJoCoUni : des primitives d'exécution persistantes et vectorisées pour MuJoCo
17arXiv cs.RO 

MuJoCoUni : des primitives d'exécution persistantes et vectorisées pour MuJoCo

Un préprint arXiv (réf. 2605.24922, mai 2026) présente MuJoCoUni, une distribution dérivée du simulateur physique MuJoCo ciblant l'apprentissage robot en ligne et l'évaluation physique batchée. L'objet central de la bibliothèque est le BatchEnvPool, un exécuteur écrit en C++ et exposé via pybind11, qui maintient des copies indépendantes de mjModel par environnement, des workers mjData par thread, et un pool de threads interne. BatchEnvPool comble ce que l'API upstream mujoco.rollout ne couvrait pas : l'exécution stateful d'environnements en parallèle, avec stepping final-state-only, reset sparse, randomisation de domaine au moment du reset (reset-lifecycle domain randomization), évaluation forward des capteurs sans avancer la dynamique, et requêtes batchées de Jacobiens et de champs de hauteur. Le package est disponible en open source via pip install mujoco-uni. L'enjeu pratique est significatif pour les pipelines de reinforcement learning robotique. L'entraînement RL en ligne exige un débit élevé de transitions simulées, souvent plusieurs milliers d'environnements en parallèle. La plupart des solutions à haute cadence comme Isaac Lab (NVIDIA) ou Brax (Google/JAX) sacrifient la fidélité physique de MuJoCo, notamment sa gestion fine des contacts et des contraintes, au profit de la vitesse GPU. MuJoCoUni prend le parti inverse : conserver la sémantique CPU de MuJoCo intacte, solveur, modèle de contact et intégrateur compris, en parallélisant uniquement au niveau de la couche de liaison Python, sans forker le coeur du simulateur. C'est une approche plus conservative, mais potentiellement plus fiable pour les tâches où la précision physique conditionne le transfert sim-to-real, notamment en manipulation dextre ou en locomotion sur terrain irrégulier. MuJoCo, développé initialement à l'Université de Washington par Emo Todorov, a été acquis par DeepMind en 2021 puis rendu open source en octobre 2022 sous licence Apache 2.0, ce qui a considérablement élargi son adoption dans la communauté RL robotique. L'écosystème s'est depuis structuré autour de plusieurs stacks concurrentes : Isaac Lab (GPU-natif, NVIDIA), Genesis (multi-backend, open source) et Brax (JAX). MuJoCoUni occupe un créneau spécifique : exécution batchée stateful sur CPU avec sémantique MuJoCo garantie, utile pour les équipes qui ne disposent pas d'infrastructure GPU ou qui exigent la reproductibilité exacte du simulateur de référence. Les auteurs publient simultanément des scripts de validation et de benchmark avec le package. Aucun déploiement industriel ni partenariat n'est annoncé à ce stade ; il s'agit d'une contribution infrastructure open source à destination des équipes de recherche et des intégrateurs construisant des pipelines RL robotiques.

InfrastructurePaper
1 source
SFG-ROS : un framework de perception multi-agents dense adaptatif aux ressources
18arXiv cs.RO 

SFG-ROS : un framework de perception multi-agents dense adaptatif aux ressources

Des chercheurs de la Hochschule Esslingen (Allemagne) ont publié en mai 2026 sur arXiv un framework logiciel nommé SFG-ROS, conçu pour déployer des flottes hétérogènes de robots en perception collaborative multi-agents. Le système cible un problème bien documenté de ROS 2 : lorsque plusieurs robots échangent simultanément des flux denses de capteurs (LiDAR, caméras stéréo de profondeur), le middleware standard génère une saturation réseau rapide, des collisions de namespaces et une charge CPU qui croît avec le nombre d'abonnés. SFG-ROS propose trois mécanismes correctifs. D'abord, un routage de trafic piloté par schéma qui isole les flux haute fréquence intra-agent du réseau global via un schéma de nommage pleinement qualifié et un routage Fast DDS ciblé. Ensuite, un pipeline de décodage centralisé à la demande qui externalise la décompression des données capteur vers un noeud dédié, supprimant le traitement redondant côté consommateurs. Enfin, un pipeline de conteneurisation agnostique au matériel qui s'adapte dynamiquement aux accélérateurs hétérogènes, du poste de développement jusqu'au déploiement terrain sans reconfiguration. Les tests menés sur une flotte mixte de robots à roues et de robots marchants montrent que SFG-ROS borne le trafic réseau en O(1) quelle que soit la taille de la flotte, et réduit la pénalité CPU par abonné de 72,3 % par rapport à ROS 2 standard, sans dégradation de latence mesurée. Ce résultat de 72,3 % de réduction CPU est significatif pour les intégrateurs industriels qui opèrent des flottes mixtes en conditions réelles : il signifie concrètement qu'ajouter un nouveau robot consommateur de données ne fait pas croître linéairement la charge de traitement sur les noeuds existants. La propriété O(1) sur le réseau est peut-être encore plus critique : elle autorise des déploiements à grande échelle sans redimensionnement de l'infrastructure réseau, ce qui change le calcul économique des entrepôts automatisés multi-AMR ou des chantiers robotisés. L'approche agnostique au matériel répond à une friction fréquente en intégration : les pipelines ROS 2 sont souvent reconfigurés manuellement à chaque changement de plateforme (Jetson, GPU server, CPU embarqué). SFG-ROS automatise ce pont, ce qui réduit le temps de mise en service. Toutefois, les résultats proviennent d'un preprint non encore évalué par les pairs, et les conditions expérimentales exactes (taille de flotte testée, volume de données par canal, latence cible) ne sont pas détaillées dans le résumé disponible, ce qui limite la transposabilité directe des chiffres à d'autres configurations. SFG-ROS est publié sous licence permissive par l'Institut für Intelligente Systeme de la Hochschule Esslingen, une école d'ingénieurs allemande active en robotique embarquée et systèmes cyber-physiques. Le projet s'inscrit dans une tendance plus large de l'écosystème ROS 2 à combler les limites de scalabilité de DDS pour les flottes denses, tendance où l'on retrouve aussi des travaux de l'Université de Bonn, d'Apex.AI ou encore des efforts de standardisation du ROS 2 TSC autour de la qualité de service DDS. Du côté des alternatives, des frameworks propriétaires comme LCM (Lightweight Communications and Marshalling) ou les middlewares internes de Boston Dynamics et ANYbotics offrent des garanties similaires mais sans interopérabilité ouverte. SFG-ROS se positionne comme une couche d'orchestration open-source au-dessus de ROS 2 existant, ce qui abaisse la barrière à l'adoption. Le code est accessible sur iis-esslingen.github.io/sfg-ros, et la prochaine étape logique serait une validation sur des flottes de taille industrielle (dizaines d'agents) avec des benchmarks de latence publiés sous charge réelle.

UEPublié sous licence permissive par une école d'ingénieurs allemande, SFG-ROS est directement exploitable par les intégrateurs européens de flottes multi-robots (entrepôts AMR, chantiers robotisés) pour scaler leurs déploiements ROS 2 sans redimensionner l'infrastructure réseau.

InfrastructureOpinion
1 source
Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA
19Robotics Business Review 

Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA

Brian Gerkey, co-fondateur d'Open Robotics et actuel directeur technique d'Intrinsic, filiale d'Alphabet dédiée aux logiciels robotiques, prendra la parole le mercredi 28 mai 2026 à 9h00 ET lors du Robotics Summit & Expo de Boston, au Thomas M. Menino Convention & Exhibition Center (salle 253 ABC). Sa conférence, intitulée "An Open Foundation for the Age of AI-Powered Robots", présentera la stratégie de l'Open Source Robotics Alliance (OSRA) en matière d'accessibilité, d'outillage moderne et de sécurité fonctionnelle. Open Robotics, organisation qui maintient le Robot Operating System (ROS) et le simulateur Gazebo, y défendra la thèse que l'open source devient une infrastructure critique à mesure que l'IA physique accélère. La session remplace une conférence initialement prévue avec Russ Tedrake, professeur au MIT et ex-vice-président senior pour les large behavior models au Toyota Research Institute. L'événement rassemble cette année plus de 70 intervenants confirmés issus d'Amazon Robotics, AWS, Tesla, Universal Robots, Brain Corp, PickNik Robotics et Robust AI, avec plus de 50 sessions réparties sur des tracks IA, design, healthcare et logistique. Le signal est moins technique qu'institutionnel. L'émergence des architectures Vision-Language-Action (VLA), des pipelines sim-to-real et des foundation models pour la robotique physique rend la standardisation des middlewares plus stratégique que jamais. ROS 2, qui reste la référence pour la communication inter-processus sur les plateformes industrielles et humanoïdes, est maintenu collectivement via l'OSRA. Pour les intégrateurs et les équipes R&D, le fait que Gerkey articule une roadmap publique au principal salon technique commercial américain de robotique signale que l'OSRA entend jouer un rôle normatif, pas seulement communautaire. La question non résolue est celle de la performance : les pipelines d'inférence GPU modernes imposent des contraintes de latence que les architectures ROS classiques gèrent mal, et c'est précisément là que se jouera la crédibilité du discours. Open Robotics a été fondée en 2012 autour de ROS, né à Willow Garage, l'un des premiers labs à industrialiser la recherche robotique aux États-Unis. Gerkey y a travaillé avant de co-fonder l'organisation, et son rattachement actuel à Intrinsic place cette prise de parole à l'intersection de la stratégie Google/Alphabet et de la gouvernance open source. Sur le plan concurrentiel, l'écosystème ROS fait face à des alternatives propriétaires croissantes : Isaac ROS de NVIDIA, les middlewares maison de Boston Dynamics ou de Figure AI, et des frameworks applicatifs comme LeRobot de HuggingFace. La prochaine étape pour l'OSRA sera de démontrer comment ROS 2 s'intègre nativement avec des architectures de foundation models en production, un point que Gerkey devrait adresser lors de sa session du 28 mai.

UEROS 2 étant la référence middleware adoptée par la majorité des équipes robotiques européennes, la roadmap OSRA articulée par Gerkey influencera les choix d'architecture pour les intégrateurs et startups FR/EU développant des robots à base de foundation models.

InfrastructureOpinion
1 source
OLO Robotics finalise son lancement commercial avec trois partenariats internationaux de fabrication et distribution
20Robotics & Automation News 

OLO Robotics finalise son lancement commercial avec trois partenariats internationaux de fabrication et distribution

OLO Robotics vient de finaliser son lancement commercial en annonçant trois partenariats de fabrication et de distribution avec Deep Robotics, inMotion Robotic et Fiction Lab. Ces accords permettent d'intégrer la plateforme ROS2-native d'OLO à des robots quadrupèdes et des robots mobiles autonomes (AMR) commercialisés par ces partenaires. La géographie de ces alliances est internationale : Deep Robotics est un fabricant chinois de quadrupèdes établi, tandis qu'inMotion Robotic et Fiction Lab opèrent sur des marchés de distribution complémentaires dont les détails n'ont pas été précisés. L'enjeu central de ce lancement est l'accessibilité : OLO vise les équipes de développement logiciel généralistes, et non les seuls roboticiens spécialisés. En s'appuyant sur ROS2 comme standard ouvert, la plateforme réduit la barrière à l'entrée pour les intégrateurs et les directions techniques industrielles souhaitant déployer des robots sans maîtriser les couches bas-niveau de contrôle. C'est un pari sur l'abstraction logicielle comme levier d'adoption à l'échelle, dans un secteur où la complexité du middleware a longtemps freiné le passage du pilote au déploiement réel. OLO s'inscrit dans une concurrence croissante sur la couche d'orchestration entre hardware robotique et applications métier, face à des acteurs comme Foxglove, Intrinsic (Alphabet) ou Transitive Robotics. Sa stratégie se distingue par des partenariats OEM pour ancrer sa plateforme dans l'écosystème matériel existant plutôt que de commercialiser du hardware en propre. Les premiers déploiements clients concrets et les timelines de mise en production n'ont pas été communiqués dans cette annonce.

UELes intégrateurs européens pourraient évaluer la plateforme ROS2 d'OLO pour simplifier leurs déploiements AMR et quadrupèdes, mais aucun acteur français ou européen n'est impliqué dans cette annonce.

InfrastructureActu
1 source
Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique
21Robotics & Automation News 

Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique

Lightwheel, startup américaine spécialisée dans l'infrastructure pour robots physiques, annonce avoir enregistré environ 100 millions de dollars de commandes au cours du seul premier trimestre 2026. La société développe des briques logicielles dédiées à la simulation, à la génération de données synthétiques, à l'évaluation de modèles et au déploiement à l'échelle de robots pilotés par de l'intelligence artificielle physique. Le communiqué ne précise ni les clients ni les volumes unitaires concernés, ce qui limite la portée des chiffres annoncés. Ce résultat, s'il se confirme, illustre un changement de phase dans le secteur : les industriels cessent d'expérimenter et commencent à chercher des solutions d'infrastructure clé-en-main pour passer des prototypes au déploiement réel. L'infrastructure de formation, simulation haute fidélité, pipelines de données synthétiques, évaluation en boucle fermée, émerge comme un marché autonome, distinct de la fabrication des robots eux-mêmes. Pour les intégrateurs et les équipes d'automatisation, cela signifie que la question n'est plus seulement "quel robot acheter ?" mais "quelle stack d'entraînement et de qualification choisir ?". Lightwheel s'inscrit dans l'écosystème dit de la "physical AI", terme popularisé par NVIDIA avec sa plateforme Isaac et ses partenaires comme Agility Robotics, Boston Dynamics ou Figure. Ses concurrents directs sur le segment données-simulation incluent Scale AI, Synthesis AI et les stacks propriétaires que développent en interne les fabricants de robots humanoïdes. La prochaine étape à surveiller : des références clients nommées et des métriques de déploiement réel, seuls indicateurs capables de valider que la demande annoncée se traduit en robots effectivement opérationnels en production.

InfrastructureActu
1 source
L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL
22Robotics Business Review 

L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL

La connectivité vision dans les systèmes robotiques traverse une mutation structurelle. Pendant près d'une décennie, les intégrateurs ont déployé des caméras USB ou Ethernet (protocole GigE Vision) pour alimenter les pipelines de perception des robots. L'USB, bon marché et universellement supporté, suffisait au prototypage, mais ses contraintes de longueur de câble, sa latence non déterministe et sa charge CPU élevée l'ont rendu inadapté aux plateformes complexes. GigE Vision a ensuite étendu la portée et standardisé les interfaces entre fournisseurs, au prix d'un processeur embarqué sur chaque caméra pour packetiser les données, ajoutant latence et complexité réseau. Aujourd'hui, le GMSL (Gigabit Multimedia Serial Link), conçu initialement pour les systèmes caméra de l'automobile, s'impose comme alternative de référence dans les architectures robotiques de nouvelle génération. Ce standard transmet des images non compressées, un contrôle bidirectionnel et l'alimentation électrique sur un unique câble coaxial ou paire torsadée blindée, sur plusieurs mètres de portée, adapté aux plateformes mobiles et articulées. La tendance est claire : les robots modernes embarquent désormais huit capteurs d'images ou plus, répartis sur l'ensemble de la structure, pour des fonctions allant de l'évitement d'obstacles à la manipulation dextre et à l'interaction humain-robot. L'enjeu pour les intégrateurs et décideurs B2B est celui du déterminisme. Les systèmes USB et Ethernet souffrent d'arbitrage et de buffering qui introduisent une variabilité de latence incompatible avec la perception temps réel : boucles de contrôle pour la manipulation, fusion LiDAR-IMU-caméra, vision stéréo synchronisée. GMSL établit une liaison point-à-point dédiée par caméra vers un calculateur centralisé (GPU embarqué ou FPGA), éliminant ces aléas. C'est un changement d'architecture, pas simplement d'interface : le traitement migre vers un noeud central unique plutôt que d'être fragmenté sur chaque caméra. Pour les plateformes qui doivent fusionner données RGB, LiDAR, radar et IMU avec une synchronisation stricte - typiquement les humanoïdes et les AMR de nouvelle génération - ce déterminisme est une exigence fonctionnelle, pas un confort. Le GMSL est issu de l'industrie automobile, où Analog Devices (ADI), principal promoteur de la technologie, l'a développé pour répondre aux exigences des systèmes ADAS et de conduite autonome : robustesse électromagnétique, temps réel, longues portées de câble. Ce transfert technologique auto-vers-robotique s'inscrit dans une dynamique plus large du secteur, où plusieurs standards automotive (Ethernet TSN, MIPI CSI-2) trouvent des débouchés dans les plateformes robotiques. ADI n'est pas seul sur ce créneau : Texas Instruments et NVIDIA proposent leurs propres écosystèmes de connectivité vision pour la robotique, et le choix d'interface reste un facteur de différenciation dans les appels d'offres industriels. À noter que l'article source est publié par ADI lui-même, ce qui invite à lire les métriques comparatives avec le recul habituel vis-à-vis des communications techniques de fournisseurs. La prochaine étape du secteur sera probablement la standardisation : des consortiums comme MIPI Alliance travaillent à harmoniser les interfaces caméra pour faciliter l'interopérabilité entre fournisseurs de capteurs, de calculateurs et intégrateurs robot.

UELes intégrateurs robotiques européens peuvent être amenés à intégrer le GMSL dans leurs cahiers des charges pour les nouvelles plateformes, mais aucun acteur ou réglementation FR/EU n'est directement impliqué.

InfrastructureActu
1 source
GMSL et l'écosystème croissant autour des systèmes de vision pour la robotique
23Robotics Business Review 

GMSL et l'écosystème croissant autour des systèmes de vision pour la robotique

Le standard GMSL (Gigabit Multimedia Serial Link), longtemps cantonné aux systèmes embarqués automobiles comme l'ADAS, s'impose progressivement dans les architectures de vision robotique industrielle. Selon Stephen Liu, responsable robotique chez Advantech, développeur de systèmes embarqués, environ un tiers des projets robotiques qu'il accompagne utilisent ou envisagent déjà des caméras GMSL. La technologie permet de transporter vidéo haute résolution, signaux de contrôle et synchronisation sur un unique câble léger, avec une latence déterministe et une résistance aux interférences électromagnétiques (EMI) significativement améliorée. Analog Devices (ADI), qui dispose d'un écosystème GMSL structuré -- modules caméra pré-validés, adaptateurs, BSP (Board Support Packages) et plateformes compatibles ROS -- positionne cette offre comme un raccourci entre preuve de concept et production de masse. L'adoption dépasse le stade POC : les plateformes AMR (robots mobiles autonomes) de logistique en sont les premiers utilisateurs en production, suivis par les robots humanoïdes, les stations de picking, les applications agricoles et certains usages en santé et construction. Ce glissement du GMSL vers la robotique répond à une contrainte système qui s'aggrave : à mesure que le nombre de capteurs embarqués augmente (caméras multiples, lidars, IMU), la gestion simultanée de la bande passante, de la latence et de la synchronisation devient le vrai goulot d'étranglement. Un décalage de quelques millisecondes entre les flux capteurs suffit à dégrader la précision de navigation. "Les robots ne font pas que voir, ils doivent décider et agir instantanément", résume Liu, ce qui impose une coordination serrée entre GPU, MPU et système d'exploitation temps réel. Dans des environnements difficiles -- vibrations, poussière, températures extrêmes, câblages longs dans des châssis compacts -- les contraintes d'ESD et d'intégrité de signal rendent les interfaces non-automotive-grade insuffisantes. Le GMSL apporte ici une robustesse éprouvée en conditions réelles, sans surcharger les équipes d'intégration d'une couche de développement bas niveau supplémentaire. La transition depuis l'automobile n'est pas anodine sur le plan industriel. Les chaînes d'outillage ADAS ont absorbé pendant une décennie les problèmes que la robotique affronte aujourd'hui : multiples caméras synchronisées, longues distances de câblage, tolérance zéro aux pannes de perception. ADI capitalise sur cet héritage pour proposer un écosystème directement transposable, réduisant les délais d'intégration de plusieurs mois à quelques semaines selon Advantech. Les concurrents directs sur ce segment -- notamment les acteurs proposant des solutions basées sur MIPI CSI-2 ou USB3 Vision -- restent pertinents pour les robots opérant en conditions contrôlées, mais peinent à répondre aux contraintes des déploiements extérieurs ou mobiles à longue durée. Les prochaines étapes portent sur l'extension vers les humanoïdes et les plateformes agricoles, segments où la densité sensorielle et la rugosité environnementale font du GMSL un candidat naturel face aux architectures plus conventionnelles.

UEL'adoption du GMSL dans les AMR et robots industriels concerne indirectement les intégrateurs et fabricants européens confrontés aux mêmes contraintes de synchronisation multi-capteurs dans leurs architectures de vision embarquée.

InfrastructureOpinion
1 source
La convergence des systèmes de perception, de l'automobile aux robots
24Robotics Business Review 

La convergence des systèmes de perception, de l'automobile aux robots

Une nouvelle génération de robots mobiles - AMR en entrepôts et hôpitaux, drones à longue autonomie, humanoïdes opérant aux côtés des humains - exige désormais des architectures de perception radicalement différentes de celles des décennies précédentes. Là où les capteurs jouaient autrefois un rôle secondaire dans le contrôle, ils constituent aujourd'hui l'entrée principale : la vision haute résolution guide la navigation et la manipulation dextère, le traitement audio multi-microphones permet la localisation sonore et l'interaction vocale, tandis que les capteurs de force et de toucher affinent la préhension et l'équilibre. Ces modalités doivent être synchronisées en temps réel pour alimenter la fusion sensorielle et les boucles de contrôle fermées. Le vrai défi n'est plus de concevoir un capteur isolé ou un modèle autonome, mais de faire fonctionner ensemble, de manière fiable, la perception, la connectivité, le calcul, l'énergie et la sécurité dans des environnements imprévisibles. Ce défi est précisément celui qu'a résolu l'industrie automobile en traitant le véhicule comme un système nerveux distribué : un réseau intégré de capteurs, de processeurs embarqués, de liaisons de communication et d'éléments de contrôle, conçu pour se comporter de façon prévisible dans des conditions réelles. La robotique converge aujourd'hui vers ce même modèle architectural. Pour les intégrateurs et les décideurs industriels, les implications sont concrètes : les données doivent arriver rapidement et de façon déterministe, les capteurs sont physiquement distribués à travers des articulations mobiles ou de longs câbles, et les défaillances doivent être détectables et localisables en temps réel. Les plateformes qui manquent d'observabilité sur l'intégrité des capteurs ou l'état énergétique deviennent de plus en plus fragiles à mesure que leur complexité augmente, rallongeant les cycles de débogage et rendant les déploiements terrain coûteux. A contrario, une architecture conçue avec des diagnostics embarqués et une connectivité déterministe réduit l'incertitude et transforme la sécurité en accélérateur d'itération plutôt qu'en contrainte. Analog Devices (ADI), fabricant de semi-conducteurs à l'interface des marchés automobile et des nouvelles mobilités, signe cette analyse pour promouvoir le transfert de ses technologies automotive-grade vers la robotique et les drones - un parti pris commercial qu'il convient de garder à l'esprit. Ces composants ont été développés sous des contraintes sévères : conditions électriques difficiles, enveloppes thermiques étroites, durées de vie longues et tolérance zéro aux défaillances silencieuses. Des liaisons vision haute bande passante et faible latence permettent, par exemple, la perception multi-caméra sur de grandes structures robotiques, tandis que des réseaux audio déterministes supportent la localisation sonore et l'interaction naturelle avec les humains. ADI se positionne ainsi face à NVIDIA (Jetson, Isaac), Qualcomm et Texas Instruments dans la fourniture de briques de traitement embarqué pour robots et drones. L'article ne cite aucun déploiement en volume ni chiffre de performance concret - il relève davantage du positionnement stratégique que du retour terrain, et les prochaines étapes évoquées restent au stade des perspectives génériques.

InfrastructureActu
1 source
Kairos : un système de déploiement extensible pour l'IA physique
25arXiv cs.RO 

Kairos : un système de déploiement extensible pour l'IA physique

Une équipe de chercheurs publie sur arXiv (référence 2605.11381, mai 2025) les spécifications de Kairos, un système d'inférence conçu pour les flottes de robots pilotées par des modèles de fondation. Kairos se positionne comme le premier système de serving multi-robot à intégrer nativement la boucle generate-execute, soit l'enchaînement asynchrone entre les phases d'inférence et d'exécution motrice propre à l'IA physique. Sur un ensemble de modèles et de plateformes robotiques, le système annonce une réduction de la latence bout-en-bout de 31,8 à 66,5 % par rapport aux pratiques de serving issues du monde de l'IA digitale, avec des gains qui s'accroissent avec la taille de la flotte déployée. L'argument central des auteurs tient à une inadéquation structurelle. Les systèmes actuels comme vLLM, TensorRT-LLM ou Triton ont été conçus pour les LLM textuels : ils traitent une requête jusqu'à complétion, sans état intermédiaire. L'IA physique fonctionne différemment : le modèle génère des blocs d'actions (action chunks) à chaque round d'inférence, le robot commence à exécuter pendant que le bloc suivant est calculé, et plusieurs cycles se succèdent sur une même tâche. Cette asynchronicité, ignorée par les serveurs digitaux classiques, crée un goulot d'étranglement critique pour les flottes industrielles. Si les chiffres se confirment en conditions réelles, les intégrateurs y gagneraient des cycles de contrôle plus courts et une capacité de scaling horizontal sans surcoût infrastructure proportionnel. Le contexte explique l'urgence de cette contribution. Depuis 2024, les modèles de fondation pour robots prolifèrent : Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA, Helix de Figure AI. Ces VLA (Vision-Language-Action) ont franchi des seuils de généralisation inédits, mais l'infrastructure de déploiement n'a pas suivi le même rythme. Kairos tente de combler ce fossé côté serving. Il s'agit néanmoins d'un preprint non revu par les pairs : les benchmarks ne sont pas détaillés dans l'abstract, les modèles et robots de test ne sont pas nommés, et aucun déploiement en production n'est déclaré. Les métriques annoncées méritent donc une lecture prudente en attendant une validation expérimentale indépendante.

InfrastructureOpinion
1 source
ORICF : un framework ouvert pour l'inférence et le contrôle en robotique
26arXiv cs.RO 

ORICF : un framework ouvert pour l'inférence et le contrôle en robotique

Des chercheurs ont publié le 12 mai 2026 sur arXiv (identifiant 2605.09656v1) un framework open source baptisé ORICF (Open Robotics Inference and Control Framework), conçu pour réduire le coût computationnel du déploiement de modèles d'IA sur robots mobiles. La plateforme, modulaire et agnostique aux modèles, permet de composer des pipelines d'inférence multimodaux via de simples fichiers de configuration YAML, sans modification du code source. Son mécanisme central, l'edge offloading, consiste à délocaliser les tâches d'inférence vers des machines externes proches du robot plutôt que de les exécuter en embarqué. Validé sur un robot mobile équipé de ROS2, le système combinait reconnaissance automatique de la parole (ASR), un grand modèle de langage (LLM) et un réseau de neurones convolutif (CNN) pour répondre à des questions orales sur les personnes détectées par sa caméra. Par rapport à une exécution entièrement embarquée, ORICF réduit l'utilisation des ressources de calcul côté robot de 83,16% et la consommation énergétique estimée de 65,8%, tout en préservant la modularité et la reproductibilité du pipeline. Ces résultats adressent l'un des freins les plus concrets au déploiement de modèles fondamentaux sur robots de service ou industriels : la contrainte matérielle embarquée. En déchargeant dynamiquement l'inférence sur des serveurs edge locaux ou des postes de travail voisins, ORICF rend envisageable l'utilisation de modèles lourds (LLM, VLM) sur plateformes à faible puissance de calcul. La spécification déclarative YAML simplifie également les changements de modèles ou de cibles matérielles, avantage concret pour les équipes intégration qui gèrent plusieurs configurations de déploiement. À noter cependant : la validation ne porte que sur un prototype unique en laboratoire, et les métriques de latence de bout en bout en conditions réelles ne sont pas détaillées dans le preprint, ce qui limite l'extrapolation aux environnements industriels. ORICF s'inscrit dans un mouvement plus large d'outillage de la robotique embarquée avec des modèles fondamentaux, alors que ROS2 s'est imposé comme infrastructure standard pour les robots de recherche et de plus en plus industriels. Plusieurs approches concurrentes ciblent le même problème : Isaac ROS de NVIDIA propose une pile d'inférence optimisée pour hardware Jetson, tandis que des acteurs comme Hailo adressent le déploiement sur puces dédiées. Le preprint ne cite pas d'affiliation universitaire ni d'entreprise sponsor visible, ce qui reste un signal à surveiller pour évaluer la maturité et la continuité du projet. Les prochaines étapes logiques seraient une validation sur des plateformes robotiques hétérogènes et une évaluation de latence en conditions opérationnelles réelles.

InfrastructureOpinion
1 source
QNX présentera des démonstrations pratiques et de nouvelles recherches au Robotics Summit
27The Robot Report 

QNX présentera des démonstrations pratiques et de nouvelles recherches au Robotics Summit

QNX, la division logicielle temps-réel de BlackBerry Ltd., sera présente au Robotics Summit & Expo les 27 et 28 mai 2025 à Boston, avec trois démonstrations interactives et le lancement d'une étude de marché inédite. Sur le stand, la société présentera un bras robotique d'entrée de gamme capable de détecter et imiter les gestes humains pour saisir des objets, en s'appuyant sur son programme QNX Everywhere qui offre un accès gratuit au logiciel pour le prototypage. Un second démonstrateur simule un environnement de "Digital Factory Automation" : un bras industriel piloté par QNX OS fusionne données lidar et vision pour détecter et éviter les obstacles en temps réel, avec réponse déterministe immédiate dès qu'un objet ou une personne entre dans son périmètre. Le troisième poste, tournant sur hardware Intel et NVIDIA, exploite la détection de pose par IA pour répliquer les mouvements d'un visiteur sur un avatar à l'écran, ciblant explicitement les plateformes utilisées dans les robots humanoïdes. En parallèle, QNX dévoilera son "Inside the Robot: Architecture Benchmark Report", une étude basée sur 1 000 développeurs en robotique à l'échelle mondiale, qui cartographie les freins à l'adoption, les écarts entre ambitions système et capacités réelles, et les tendances du secteur. John Wall, président de QNX, participera au keynote d'ouverture "Building the Next Era of Robot Autonomy" aux côtés de représentants d'Amazon Robotics, Locus Robotics et Universal Robots. La participation de QNX à ce salon illustre une tension structurelle du marché : les équipes d'IA embarquée savent entraîner des modèles, mais peinent à garantir le comportement déterministe requis dès lors que ces modèles pilotent des actionneurs physiques en environnement humain. QNX positionne son RTOS (Real-Time Operating System) comme la couche d'exécution qui traduit les décisions d'un VLA (Vision-Language-Action model) ou d'un module de pose detection en commandes moteur à latence bornée et prévisible. Le benchmark report est potentiellement plus significatif que les démos : avec 1 000 répondants développeurs, il devrait objectiver les vrais goulots d'étranglement du cycle sim-to-real, là où la majorité des communications sectorielles restent des annonces produit sans données comparatives. Pour un COO industriel ou un intégrateur, la question clé n'est pas "est-ce que le bras évite les obstacles en démo" mais "quel est le taux de défaillance certifiable en production", ce que l'étude prétend adresser. QNX existe depuis 1980 et son RTOS est historiquement déployé dans l'automobile (ADAS, infotainment), le médical et l'aérospatiale, des secteurs où la certification fonctionnelle (ISO 26262, IEC 61508) est non-négociable. L'entrée en robotique collaborative et humanoïde représente une extension logique à mesure que ces systèmes quittent les cages industrielles pour les entrepôts et espaces partagés. Sur ce terrain, QNX affronte Wind River (VxWorks), ROS 2 avec son middleware DDS pour le temps-réel souple, et des stacks propriétaires comme ceux qu'embarquent Boston Dynamics ou Figure AI. Le programme QNX Everywhere, qui ouvre l'accès gratuit pour le prototypage, est une réponse directe à l'adoption massive de ROS dans les labs universitaires et startups. Les suites concrètes à surveiller : la publication du benchmark report lors du salon, et d'éventuelles annonces de partenariats OEM avec des fabricants de bras collaboratifs ou de plateformes humanoïdes dans les mois suivants.

InfrastructureOpinion
1 source
XYZ Embodied AI lance le sac à dos de calcul embarqué BotPack B Series
28Pandaily 

XYZ Embodied AI lance le sac à dos de calcul embarqué BotPack B Series

XYZ Embodied AI (星源智机器人) a présenté le 23 avril 2026 au salon Hannover Messe en Allemagne sa gamme BotPack B Series, un sac à dos de calcul embarqué destiné aux robots quadrupèdes et humanoïdes. La gamme comprend deux modèles, le B5 et le B4, tous deux propulsés par des puces NVIDIA. L'ensemble pèse moins de 2,5 kg et embarque des interfaces réseau haut débit (Ethernet 10G, 5G et Wi-Fi 7) ainsi que des modules de positionnement pour la navigation autonome. La compatibilité a été confirmée avec le robot humanoïde Unitree G1 de Unitree Robotics. L'objectif affiché est de permettre aux robots d'exécuter des modèles d'IA localement, en réduisant la dépendance au cloud et la latence de traitement associée. La mise en production de capacités de calcul edge directement sur le châssis d'un robot répond à un verrou opérationnel fréquemment cité par les intégrateurs : la dépendance à une connectivité cloud stable nuit aux déploiements en environnements industriels contraints, ateliers, entrepôts ou zones à couverture réseau limitée. Un backpack standardisé compatible avec plusieurs plateformes ouvre la voie à une séparation entre matériel robot et compute stack, une logique analogue à celle des AMR modulaires. La connectivité Wi-Fi 7 et 5G, couplée à un Ethernet 10G, cible clairement les cas d'usage en inférence temps réel de modèles VLA (Vision-Language-Action), où la latence est critique. Il reste à valider en conditions réelles quelle charge de modèle les configurations B4 et B5 peuvent effectivement supporter, XYZ n'ayant publié ni benchmarks ni données terrain. XYZ Embodied AI avait précédemment développé la plateforme T5, une unité de calcul embarqué positionnée sur le même segment ; la BotPack B Series constitue une évolution vers des formats plus compacts et universels. Hannover Messe 2026 concentre plusieurs annonces dans le domaine du edge computing pour la robotique, un marché en structuration où NVIDIA pousse son stack Isaac/Jetson et où des startups spécialisées compute-on-robot émergent. La compatibilité affichée avec le Unitree G1 positionne le produit face aux solutions de compute intégrées des fabricants humanoïdes comme Agility Robotics ou Figure AI. Aucun prix ni volume de déploiement n'a été communiqué, ce qui classe cette annonce comme lancement commercial sans validation industrielle publique à ce stade.

UELes intégrateurs robotiques européens présents à Hannover Messe peuvent découvrir une solution de compute embarqué potentiellement compatible avec leurs plateformes humanoïdes ou quadrupèdes, mais l'absence de prix, de benchmarks et de déploiements validés rend toute décision d'achat prématurée.

InfrastructureOpinion
1 source
Hesai dévoile sa stratégie et de nouveaux produits pour redéfinir l'infrastructure d'IA physique, de l'automobile à la robotique
29Pandaily 

Hesai dévoile sa stratégie et de nouveaux produits pour redéfinir l'infrastructure d'IA physique, de l'automobile à la robotique

Le 17 avril 2026, Hesai Technology (NASDAQ: HSAI, HKEX: 2525) a tenu son Technology Open Day annuel pour dévoiler le Picasso SPAD-SoC, présenté comme le premier chip LiDAR 6D full-color au monde. Ce circuit intègre à la fois la détection couleur RGB et la mesure de distance par temps de vol (TOF) au niveau pixel, générant directement des nuages de points colorés sans post-traitement. Le LiDAR traditionnel se limite aux trois dimensions spatiales XYZ ; le Picasso ajoute la teinte (RGB), portant à six les dimensions de perception simultanée. Son efficacité de détection photonique (PDE) dépasse 40 %, ce qui permet de détecter des objets plus lointains et de mieux performer en faible luminosité. Ce chip alimente la série ETX, plateforme LiDAR full-color dépassant 1 000 lignes, disponible en configurations 1 080, 2 160 et 4 320 lignes. En version haute résolution, le ETX affiche une portée jusqu'à 600 mètres, 400 mètres à 10 % de réflectivité, et est capable d'identifier une barrière de chantier à 300 mètres, un petit animal à 280 mètres, ou un bloc de bois à 150 mètres. La mise en production de masse est prévue pour le second semestre 2026, avec un déploiement sur des modèles phares attendu entre 2027 et 2028. L'annonce repositionne Hesai sur un marché en pleine redéfinition : le passage de la voiture autonome de niveau 2+ vers le L3 exige que le LiDAR passe du statut de composant optionnel à celui de système de sécurité critique. Les architectures véhicules basculent vers des configurations multi-LiDAR (typiquement 3 à 6 capteurs pour une couverture 360°), ce qui démultiplie les volumes par véhicule. Le fait que Hesai soit aujourd'hui le seul fabricant de LiDAR à développer en interne l'intégralité de ses sept composants clés, lasers, détecteurs, drivers, TIA, ADC, DSP et contrôleurs, lui confère une autonomie verticale rare dans un secteur très dépendant des fournisseurs asiatiques de semi-conducteurs. Avec 21 puces certifiées AEC-Q, 230 millions d'unités livrées cumulées et des commandes constructeurs dépassant les 6 millions d'unités pour les seuls produits basés sur le Fermi C500 (lancé en novembre 2025 sur architecture RISC-V), Hesai présente des métriques de commercialisation réels, pas seulement des démonstrations de laboratoire. Fondée à Shanghai, Hesai a construit son écosystème chip en cinq générations de R&D. La dénomination "Picasso", référence au peintre cubiste et à sa maîtrise de la représentation multidimensionnelle, marque symboliquement le pivot stratégique de l'entreprise vers ce qu'elle appelle l'"intelligence spatiale", matérialisé par le nouveau produit Kosmo (hardware IA spatial) et une direction inédite autour de modules d'alimentation pour la robotique. Sur ce dernier segment, Hesai entre en compétition directe avec des acteurs comme Ouster (désormais Ouster-Velodyne fusionné avec Sense Photonics), Luminar, ou encore RoboSense, qui ciblent tous la robotique humanoïde et les AMR industriels. Hesai prévoit que ses livraisons cumulées dépasseront 300 millions d'unités d'ici fin 2026. Les prochaines étapes attendues concernent les homologations L3 par les constructeurs partenaires et les premières intégrations Kosmo dans des environnements de test physique AI, mais aucun client ni calendrier précis n'a été communiqué sur ces deux points.

InfrastructureActu
1 source
Memories.ai développe une couche de mémoire visuelle pour les wearables et la robotique
30TechCrunch AI 

Memories.ai développe une couche de mémoire visuelle pour les wearables et la robotique

Memories.ai développe un grand modèle de mémoire visuelle capable d'indexer et de retrouver des souvenirs enregistrés en vidéo pour l'IA physique. Cette technologie vise à constituer la couche de mémoire visuelle pour les wearables et la robotique. L'objectif est de permettre aux appareils physiques dotés d'IA de mémoriser et rappeler des expériences visuelles de manière efficace.

InfrastructureActu
1 source
Kernels Personnalisés pour Tous, grâce à Codex et Claude
31HuggingFace Blog 

Kernels Personnalisés pour Tous, grâce à Codex et Claude

Titre: Puces personnalisées pour tous, grâce à Codex et Claude Résumé: Codex, issu de OpenAI, et Claude, développé par Anthropic, offrent désormais des noyaux personnalisables pour améliorer les performances des systèmes d'IA, permettant aux utilisateurs de moduler les paramètres en fonction de leurs besoins spécifiques.

UECodex et Claude, deux IA avancées, facilitent l'accès aux noyaux personnalisables pour améliorer les systèmes d'IA, impactant potentiellement les entreprises françaises et européennes telles qu'OVHcloud, en les aidant à optimiser leurs services cloud, tout en respectant les réglementations strictes comme le RGPD.

InfrastructureOutil
1 source
OpenAI s'associe à Cerebras
32OpenAI Blog 

OpenAI s'associe à Cerebras

OpenAI s'allie à Cerebras pour intégrer 750 mégawatts de puissance de calcul AI de haute vitesse, réduisant ainsi le temps de latence d'inférence et rendant ChatGPT plus rapide pour les charges de travail AI en temps réel.

UECette collaboration entre OpenAI et Cerebras pourrait accélérer les processus de calcul AI en France et en Europe, favorisant les innovations technologiques pour les entreprises telles qu'Astria Space et Naval Group, tout en potentiellement améliorant la conformité avec l'AI Act, grâce à des avancées en matière de traitement des données en temps réel.

InfrastructureActu
1 source
Participez à l'Hackathon Open Robotics d'AMD
33HuggingFace Blog 

Participez à l'Hackathon Open Robotics d'AMD

"Rejoignez le Hackathon Open Robotics d'AMD" AMD organise un Hackathon Open Source pour le développement de logiciels de robotique, invitant les programmeurs à collaborer sur des projets utilisant la plateforme RTOS AMDLinux. L'événement aura lieu en ligne, offrant aux participants la possibilité de gagner des prix et de contribuer à des projets open-source.

UEAMD lance un hackathon open-source pour la robotique, impliquant des programmeurs européens et potentiellement français, aligné avec les tendances open-source et les normes éthiques de l'UE, favorisant l'innovation dans le secteur des technologies de la robotique tout en respectant les directives du RGPD pour la gestion des données.

InfrastructureOutil
1 source
Construire un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac
34HuggingFace Blog 

Construire un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac

Titre: Construction d'un robot de santé à partir de simulation jusqu'à déploiement avec NVIDIA Isaac Résumé: NVIDIA Isaac aide à construire un robot médical, passant par la simulation et le déploiement réel, en utilisant des technologies de réalité augmentée et de traitement d'images pour améliorer les soins aux patients.

UENVIDIA Isaac facilite la création de robots médicaux en France, intégrant la réalité augmentée et l'analyse d'images, en respectant les réglementations telles que le RGPD, pour améliorer les soins de santé.

InfrastructureOutil
1 source
Comment concevoir un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac pour le secteur de la santé
35HuggingFace Blog 

Comment concevoir un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac pour le secteur de la santé

Cet article détaille la construction d'un robot de santé à l'aide de NVIDIA Isaac for Healthcare, passant de la simulation à la mise en production. Il met en avant l'utilisation de la plateforme NVIDIA Isaac pour simuler, entraîner et déployer un robot dans un environnement de soins de santé. Les chiffres clés incluent une réduction de 90% du temps de développement grâce à la simulation et des améliorations significatives dans la précision et l'efficacité des tâches robotiques.

UEUtilisation de NVIDIA Isaac for Healthcare pour construire des robots de santé, réduisant le temps de développement de 90% via simulation, impactant le secteur de la santé en France et en Europe, en améliorant la précision et l'efficacité des tâches robotiques, conforme potentiellement aux exigences de l'AI Act et RGPD.

InfrastructureOutil
1 source