Aller au contenu principal
InfrastructureNVIDIA Developer Blog2h

Déployer une IA à base d'agents en périphérie avec efficacité mémoire grâce à NVIDIA JetPack 7.2

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

NVIDIA a publié JetPack 7.2, une mise à jour de sa suite logicielle pour les modules Jetson, ciblant le déploiement d'agents IA en périphérie (edge computing). La nouveauté centrale est le support natif en une seule commande de NemoClaw, une stack open source qui étend OpenClaw en y ajoutant des couches de contrôle de confidentialité et de sécurité. La version introduit également des "agent skills" pour Jetson, des briques logicielles pré-packagées conçues pour accélérer le développement d'agents autonomes sur matériel embarqué, accompagnées d'optimisations mémoire visant à améliorer les performances dans des configurations à ressources contraintes.

Le passage des agents IA vers des environnements physiques impose des contraintes radicalement différentes du cloud : latence faible, connectivité intermittente et enveloppes mémoire restreintes. L'intégration native de NemoClaw dans JetPack 7.2 positionne Jetson comme plateforme de référence pour des agents embarqués avec garanties explicites de sécurité et de confidentialité des données, un argument commercial décisif pour les déploiements industriels, médicaux ou logistiques où les données sensibles ne peuvent quitter le site. Pour les intégrateurs, la simplification à une seule commande réduit significativement la friction d'adoption.

NVIDIA commercialise les modules Jetson depuis 2014 et JetPack 7.2 s'inscrit dans sa stratégie de déport progressif de l'inférence IA hors du datacenter. OpenClaw, sur lequel NemoClaw s'appuie, est l'environnement d'exécution agent de NVIDIA pour l'edge. Les concurrents directs sur ce segment incluent Qualcomm avec son AI Hub et son Robotics SDK, ainsi que Hailo, Google Coral et Kneron. L'annonce reste au stade de disponibilité logicielle : aucun chiffre de volume de déploiement ni timeline client n'a été communiqué.

Impact France/UE

Les intégrateurs européens déployant des agents IA embarqués sur Jetson dans des contextes industriels, médicaux ou logistiques bénéficient d'une simplification d'adoption et de garanties de confidentialité des données conformes aux exigences réglementaires locales (RGPD, AI Act).

À lire aussi

1NVIDIA Blog Robotics 

NVIDIA Jetson amène l'IA à base d'agents dans le monde physique

Lors du salon COMPUTEX à Taipei le 27 mai 2026, NVIDIA a annoncé JetPack 7.2 et le support de NemoClaw sur la plateforme Jetson, marquant une étape concrète dans le déploiement de l'IA agentique sur des systèmes embarqués physiques. JetPack 7.2 apporte le support du projet Yocto pour une distribution Linux allégée et personnalisable, CUDA 13 sur Jetson Orin, et le support MIG (Multi-Instance GPU) couplé à un noyau temps réel sur Jetson Thor, permettant de réserver des ressources GPU dédiées à des tâches déterministes comme la perception robotique. Le module Jetson AGX Orin 32 Go gagne également 20 % de performances, atteignant 241 TOPS d'inférence IA. NemoClaw, le framework agentique de NVIDIA, se déploie désormais sur Jetson en une seule commande. Deux partenaires sont déjà en production : Solomon, qui utilise NemoClaw pour coordonner raisonnement, perception, fusion de capteurs, locomotion et manipulation sur un robot humanoïde, et Advantech, qui déploie un "cerveau d'usine agentique" dans ses propres lignes de fabrication en combinant NemoClaw, Nemotron 3 et Jetson Thor pour la gestion de flottes robotiques et l'inspection de défauts. L'importance de cette annonce réside dans le passage de l'IA agentique des serveurs vers les systèmes embarqués en production industrielle, un écart que l'industrie peinait à combler. L'architecture en trois couches proposée, OS + compute en base (JetPack), skills d'automatisation développeur au milieu, et NemoClaw en orchestrateur applicatif au sommet, permet aux intégrateurs de construire des workflows agentiques complets sans infrastructure cloud. Pour un COO industriel ou un ingénieur robotique, le gain annoncé est celui du time-to-market : des tâches de déploiement et de configuration qui prenaient plusieurs semaines peuvent désormais être réduites à quelques jours grâce aux agent skills dérivées de la documentation officielle NVIDIA. Le support MIG sur Thor est particulièrement significatif pour les applications robotiques réelles, où l'inférence temps réel ne peut pas être interrompue par des tâches d'IA concurrentes. Il faut toutefois noter que les chiffres de performance et les gains de productivité annoncés proviennent du communiqué de presse NVIDIA lui-même, sans benchmark indépendant disponible à ce stade. La plateforme Jetson est déjà déployée dans des secteurs variés, notamment la robotique industrielle, les drones, les dispositifs médicaux, les machines agricoles et les systèmes humanoïdes, et constitue depuis plusieurs générations, Orin puis Thor, l'un des compute modules embarqués les plus répandus dans l'industrie. NemoClaw s'inscrit dans la stratégie d'NVIDIA de descendre son stack agentique, initialement développé pour les serveurs DGX, vers l'edge et les systèmes physiques autonomes. Sur le plan concurrentiel, cette annonce positionne NVIDIA face à des alternatives edge comme Qualcomm (RB5/RB6 pour la robotique) et Google Coral, mais aussi face aux SOC propriétaires développés par Boston Dynamics, Figure ou 1X pour leurs propres humanoïdes. Les prochaines étapes annoncées incluent l'extension des Metropolis VSS blueprint skills pour l'interprétation visuelle agentique, et la diffusion de l'événement Build-a-Claw à Taiwan, signe que NVIDIA cherche à ancrer son écosystème développeur en Asie du Sud-Est, région clé pour la fabrication électronique et robotique mondiale.

UELes intégrateurs robotiques européens sur Jetson Orin/Thor peuvent déployer des workflows agentiques complets sans cloud, réduisant potentiellement le time-to-market de plusieurs semaines à quelques jours, gain concret pour l'automatisation industrielle EU, sans validation indépendante à ce stade.

InfrastructureOpinion
1 source
2The Robot Report 

NVIDIA publie de nouveaux outils et des mises à jour pour les développeurs d'IA physique

Lors du GTC Taipei et du Computex, NVIDIA a dévoilé un ensemble de nouveaux outils open-source rassemblés sous le nom NVIDIA Agent Toolkit, destinés aux développeurs de systèmes d'IA physique : robotique, véhicules autonomes, vision industrielle et jumeaux numériques. L'objectif affiché est de réduire le coût et la complexité des pipelines de développement en rendant l'ensemble de la pile logicielle de NVIDIA directement orchestrable par des agents IA. Les outils concernés incluent Cosmos 3, le modèle de fondation pour la compréhension du monde physique (vidéo, texte, prédiction d'états futurs), les bibliothèques Omniverse pour la simulation et les jumeaux numériques, Isaac pour la robotique, Metropolis pour la vision IA, Alpamayo pour la conduite autonome, et la plateforme Jetson pour le déploiement embarqué. Le déploiement sécurisé de ces agents est encadré par le blueprint NemoClaw et le runtime OpenShell, qui appliquent des politiques de sécurité et de confidentialité en local comme dans le cloud. L'approche "agent-ready" de NVIDIA marque un changement de paradigme dans le développement de l'IA physique : plutôt que des bibliothèques que les ingénieurs assemblent manuellement, les outils deviennent des briques directement appelables par des agents de codage, capables d'enchaîner automatiquement génération de données, simulation, entraînement et évaluation. Pour les développeurs de véhicules autonomes, cela signifie qu'un agent peut reconstruire des scènes à partir de données de flotte, générer des scénarios de conduite photoréalistes et lancer des boucles de renforcement sans intervention manuelle à chaque étape. Pour les intégrateurs robotiques, des tâches comme l'automatisation de l'entraînement à la navigation ou le tuning de systèmes Jetson deviennent théoriquement scriptables. Rev Lebaredian, vice-président pour la simulation d'IA physique chez NVIDIA, a qualifié Cosmos 3 de "modèle de fondation frontier pour l'IA physique", capable de comprendre vidéo et texte, de prédire les états futurs et de générer des actions, positionnant ce world model comme un candidat généraliste opérationnel, même si aucune métrique de benchmark indépendante n'a été communiquée à ce stade. NVIDIA consolide avec cette annonce sa position d'infrastructure de référence pour l'IA physique, un rôle qu'elle occupe via ses GPU d'entraînement et ses plateformes Isaac Sim et Jetson. La compétition dans ce segment s'intensifie : Google DeepMind pousse MuJoCo et ses dérivés, Boston Dynamics, Figure, Agility Robotics et Physical Intelligence développent leurs propres stacks de simulation et d'apprentissage, tandis que des acteurs industriels comme Siemens ou ANSYS occupent le terrain des jumeaux numériques. En Europe, des entreprises comme Wandercraft ou Enchanted Tools pourraient bénéficier de ces outils si la promesse de réduction de complexité se confirme en pratique. NVIDIA joue ici la carte de la plateforme unifiée plutôt que du modèle de fondation isolé, un positionnement cohérent avec son modèle d'affaires mais qui reste à valider au-delà des démonstrations internes. Les suites annoncées incluent des applications en santé, dont le détail n'a pas été entièrement communiqué lors de l'événement.

UELes entreprises françaises comme Wandercraft et Enchanted Tools pourraient bénéficier de la réduction de complexité annoncée, mais aucun déploiement européen concret n'est confirmé à ce stade.

InfrastructureOpinion
1 source
ICAN-Deploy : déploiement canari à identité stable pour agents incarnés en environnements critiques
3arXiv cs.RO 

ICAN-Deploy : déploiement canari à identité stable pour agents incarnés en environnements critiques

Des chercheurs présentent ICAN-Deploy (Identity-stable CANary Deployment), un middleware conçu pour faire évoluer le logiciel de robots certifiés sans invalider leur certification. Le principe du déploiement canary, router une fraction du trafic vers une nouvelle version, surveiller des métriques, puis rollback si régression, est standard en DevOps cloud. Problème : les contrôleurs du marché, Argo Rollouts, Spinnaker et Flagger, modifient l'identité cryptographique du système durant la fenêtre de transition. Ce drift est inoffensif pour des microservices sans état, mais rompt pour les robots l'assurance réglementaire centrale : "l'agent certifié est l'agent déployé". ICAN-Deploy sépare les noms de capacités, figés et hachés dans le manifeste, des versions de capacités, un état runtime mutable, maintenant ainsi le hash d'identité invariant tout au long du cycle. Les auteurs valident l'invariance par preuve formelle, lint AST et model-checking TLA+, puis corroborent sur N=100 cycles canary dans un environnement MuJoCo simulant un bras Franka Panda : zéro drift observé, latence d'entrée 95% BCa CI [1,52 ; 2,01] ms. L'enjeu est structurel pour l'industrie. Dans les secteurs à certification obligatoire (médical, aérospatial, industrie lourde), chaque mise à jour logicielle d'un robot peut déclencher un cycle de revalidation de plusieurs semaines. ICAN-Deploy renverse la logique : certifier une architecture de déploiement plutôt que chaque version individuelle. Un système certifié une fois peut ensuite évoluer librement dans l'enveloppe nom-version définie, sans recertification formelle. C'est un déblocage potentiel pour le continuous delivery sur robots en environnement de production. Le "strawman" alternatif testé, qui incorpore les versions dans le manifeste d'identité, échoue systématiquement sur les mêmes workloads, renforçant la valeur de la comparaison. La gestion du cycle de vie logiciel des agents physiques reste un angle mort du secteur robotique. Ce travail s'inscrit dans la tendance émergente du "runtime governance" pour LLMs et agents incarnés, cherchant à réconcilier l'agilité du software moderne et les contraintes de sûreté des systèmes physiques. Le Franka Panda, standard de fait en recherche sur la manipulation depuis le rachat d'Emika GmbH par Agile Robots, facilite la reproductibilité des résultats. Le papier est un preprint arXiv (arXiv:2605.28097v1), non encore peer-reviewed, et les métriques restent à confirmer sur hardware réel hors simulation. Les étapes naturelles : intégration dans ROS 2 ou OpenRMF, et validation du modèle "certifier l'architecture, pas la version" par des organismes de certification sectoriels.

UEL'approche pourrait alléger les cycles de recertification imposés aux robots opérant dans les secteurs réglementés européens (médical, aérospatial, machinerie) au regard de la Directive Machines et des dispositions à hauts risques du règlement IA.

InfrastructureOpinion
1 source
Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA
4Robotics Business Review 

Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA

Brian Gerkey, co-fondateur d'Open Robotics et actuel directeur technique d'Intrinsic, filiale d'Alphabet dédiée aux logiciels robotiques, prendra la parole le mercredi 28 mai 2026 à 9h00 ET lors du Robotics Summit & Expo de Boston, au Thomas M. Menino Convention & Exhibition Center (salle 253 ABC). Sa conférence, intitulée "An Open Foundation for the Age of AI-Powered Robots", présentera la stratégie de l'Open Source Robotics Alliance (OSRA) en matière d'accessibilité, d'outillage moderne et de sécurité fonctionnelle. Open Robotics, organisation qui maintient le Robot Operating System (ROS) et le simulateur Gazebo, y défendra la thèse que l'open source devient une infrastructure critique à mesure que l'IA physique accélère. La session remplace une conférence initialement prévue avec Russ Tedrake, professeur au MIT et ex-vice-président senior pour les large behavior models au Toyota Research Institute. L'événement rassemble cette année plus de 70 intervenants confirmés issus d'Amazon Robotics, AWS, Tesla, Universal Robots, Brain Corp, PickNik Robotics et Robust AI, avec plus de 50 sessions réparties sur des tracks IA, design, healthcare et logistique. Le signal est moins technique qu'institutionnel. L'émergence des architectures Vision-Language-Action (VLA), des pipelines sim-to-real et des foundation models pour la robotique physique rend la standardisation des middlewares plus stratégique que jamais. ROS 2, qui reste la référence pour la communication inter-processus sur les plateformes industrielles et humanoïdes, est maintenu collectivement via l'OSRA. Pour les intégrateurs et les équipes R&D, le fait que Gerkey articule une roadmap publique au principal salon technique commercial américain de robotique signale que l'OSRA entend jouer un rôle normatif, pas seulement communautaire. La question non résolue est celle de la performance : les pipelines d'inférence GPU modernes imposent des contraintes de latence que les architectures ROS classiques gèrent mal, et c'est précisément là que se jouera la crédibilité du discours. Open Robotics a été fondée en 2012 autour de ROS, né à Willow Garage, l'un des premiers labs à industrialiser la recherche robotique aux États-Unis. Gerkey y a travaillé avant de co-fonder l'organisation, et son rattachement actuel à Intrinsic place cette prise de parole à l'intersection de la stratégie Google/Alphabet et de la gouvernance open source. Sur le plan concurrentiel, l'écosystème ROS fait face à des alternatives propriétaires croissantes : Isaac ROS de NVIDIA, les middlewares maison de Boston Dynamics ou de Figure AI, et des frameworks applicatifs comme LeRobot de HuggingFace. La prochaine étape pour l'OSRA sera de démontrer comment ROS 2 s'intègre nativement avec des architectures de foundation models en production, un point que Gerkey devrait adresser lors de sa session du 28 mai.

UEROS 2 étant la référence middleware adoptée par la majorité des équipes robotiques européennes, la roadmap OSRA articulée par Gerkey influencera les choix d'architecture pour les intégrateurs et startups FR/EU développant des robots à base de foundation models.

InfrastructureOpinion
1 source