Aller au contenu principal
InfrastructureThe Robot Report2h

NVIDIA publie de nouveaux outils et des mises à jour pour les développeurs d'IA physique

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Lors du GTC Taipei et du Computex, NVIDIA a dévoilé un ensemble de nouveaux outils open-source rassemblés sous le nom NVIDIA Agent Toolkit, destinés aux développeurs de systèmes d'IA physique : robotique, véhicules autonomes, vision industrielle et jumeaux numériques. L'objectif affiché est de réduire le coût et la complexité des pipelines de développement en rendant l'ensemble de la pile logicielle de NVIDIA directement orchestrable par des agents IA. Les outils concernés incluent Cosmos 3, le modèle de fondation pour la compréhension du monde physique (vidéo, texte, prédiction d'états futurs), les bibliothèques Omniverse pour la simulation et les jumeaux numériques, Isaac pour la robotique, Metropolis pour la vision IA, Alpamayo pour la conduite autonome, et la plateforme Jetson pour le déploiement embarqué. Le déploiement sécurisé de ces agents est encadré par le blueprint NemoClaw et le runtime OpenShell, qui appliquent des politiques de sécurité et de confidentialité en local comme dans le cloud.

L'approche "agent-ready" de NVIDIA marque un changement de paradigme dans le développement de l'IA physique : plutôt que des bibliothèques que les ingénieurs assemblent manuellement, les outils deviennent des briques directement appelables par des agents de codage, capables d'enchaîner automatiquement génération de données, simulation, entraînement et évaluation. Pour les développeurs de véhicules autonomes, cela signifie qu'un agent peut reconstruire des scènes à partir de données de flotte, générer des scénarios de conduite photoréalistes et lancer des boucles de renforcement sans intervention manuelle à chaque étape. Pour les intégrateurs robotiques, des tâches comme l'automatisation de l'entraînement à la navigation ou le tuning de systèmes Jetson deviennent théoriquement scriptables. Rev Lebaredian, vice-président pour la simulation d'IA physique chez NVIDIA, a qualifié Cosmos 3 de "modèle de fondation frontier pour l'IA physique", capable de comprendre vidéo et texte, de prédire les états futurs et de générer des actions, positionnant ce world model comme un candidat généraliste opérationnel, même si aucune métrique de benchmark indépendante n'a été communiquée à ce stade.

NVIDIA consolide avec cette annonce sa position d'infrastructure de référence pour l'IA physique, un rôle qu'elle occupe via ses GPU d'entraînement et ses plateformes Isaac Sim et Jetson. La compétition dans ce segment s'intensifie : Google DeepMind pousse MuJoCo et ses dérivés, Boston Dynamics, Figure, Agility Robotics et Physical Intelligence développent leurs propres stacks de simulation et d'apprentissage, tandis que des acteurs industriels comme Siemens ou ANSYS occupent le terrain des jumeaux numériques. En Europe, des entreprises comme Wandercraft ou Enchanted Tools pourraient bénéficier de ces outils si la promesse de réduction de complexité se confirme en pratique. NVIDIA joue ici la carte de la plateforme unifiée plutôt que du modèle de fondation isolé, un positionnement cohérent avec son modèle d'affaires mais qui reste à valider au-delà des démonstrations internes. Les suites annoncées incluent des applications en santé, dont le détail n'a pas été entièrement communiqué lors de l'événement.

Impact France/UE

Les entreprises françaises comme Wandercraft et Enchanted Tools pourraient bénéficier de la réduction de complexité annoncée, mais aucun déploiement européen concret n'est confirmé à ce stade.

À lire aussi

Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique
1Pandaily 

Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique

Lightwheel AI, startup pékinoise spécialisée dans l'infrastructure de données et de simulation pour l'IA physique, vient de boucler un nouveau tour de financement dont le montant n'a pas été divulgué. Les fonds seront affectés à trois axes : élargir les capacités de livraison, accélérer l'expansion internationale, et renforcer les partenariats avec des fabricants de robots, des développeurs de véhicules autonomes et des industriels. La société propose un triptyque de services : génération de données d'entraînement synthétiques haute qualité, environnements de simulation pour l'entraînement de modèles, et frameworks d'évaluation et de vérification. Son positionnement repose sur une boucle fermée couvrant la collecte terrain, le développement de simulateurs, l'évaluation et le déploiement en production. La technologie centrale est une approche propriétaire baptisée "calibration sur données réelles + amplification par simulation" : des données capteurs réelles servent de base de calibration, puis la simulation génère des jeux de données synthétiques à grande échelle qui reproduisent les propriétés statistiques du réel tout en étendant la couverture des cas limites et scénarios rares. Ce tour illustre une conviction croissante dans le secteur : avant d'entraîner des robots ou des VLA (Vision-Language-Action models) performants, il faut disposer d'une infrastructure de données robuste et reproductible. La plupart des acteurs de l'IA physique butent aujourd'hui sur le "sim-to-real gap" et sur le coût prohibitif de la collecte de données en environnement réel. Une approche de type "real data calibration + sim amplification" vise précisément à réduire ce coût tout en préservant la validité statistique des données, un défi technique non trivial. Si la méthode s'avère scalable, elle pourrait raccourcir significativement les cycles de développement pour les intégrateurs robotiques et réduire la dépendance aux flottes de collecte physique, aujourd'hui l'un des postes de coût les plus lourds du secteur. Matrix Partners China avait déjà mené le tour Pre-A de Lightwheel en décembre 2023, puis sursouscrit le Pre-A+ suivant, s'établissant comme principal investisseur institutionnel de la société. Ce suivi répété est un signal fort, dans un contexte où l'écosystème de l'IA physique chinois s'organise rapidement autour de couches d'infrastructure distinctes : données, simulation, fondation model, application. Les concurrents directs sur ce segment incluent des acteurs comme Scale AI ou Rendered.ai côté occidental, et plusieurs startups chinoises moins visibles à l'international. Le managing partner Tong Ti a déclaré que 2025-2026 marque "l'année du déploiement à l'échelle" pour l'IA physique, ce qui reste un cadrage marketing à surveiller : le passage de la démonstration au déploiement industriel réel, surtout dans la robotique humanoïde, prend systématiquement plus de temps qu'annoncé. Aucun client nommé, aucun volume de données chiffré, aucun site de déploiement mentionné dans le communiqué, ce qui limite pour l'instant l'évaluation indépendante des affirmations techniques.

InfrastructureActu
1 source
Hesai dévoile sa stratégie et de nouveaux produits pour redéfinir l'infrastructure d'IA physique, de l'automobile à la robotique
2Pandaily 

Hesai dévoile sa stratégie et de nouveaux produits pour redéfinir l'infrastructure d'IA physique, de l'automobile à la robotique

Le 17 avril 2026, Hesai Technology (NASDAQ: HSAI, HKEX: 2525) a tenu son Technology Open Day annuel pour dévoiler le Picasso SPAD-SoC, présenté comme le premier chip LiDAR 6D full-color au monde. Ce circuit intègre à la fois la détection couleur RGB et la mesure de distance par temps de vol (TOF) au niveau pixel, générant directement des nuages de points colorés sans post-traitement. Le LiDAR traditionnel se limite aux trois dimensions spatiales XYZ ; le Picasso ajoute la teinte (RGB), portant à six les dimensions de perception simultanée. Son efficacité de détection photonique (PDE) dépasse 40 %, ce qui permet de détecter des objets plus lointains et de mieux performer en faible luminosité. Ce chip alimente la série ETX, plateforme LiDAR full-color dépassant 1 000 lignes, disponible en configurations 1 080, 2 160 et 4 320 lignes. En version haute résolution, le ETX affiche une portée jusqu'à 600 mètres, 400 mètres à 10 % de réflectivité, et est capable d'identifier une barrière de chantier à 300 mètres, un petit animal à 280 mètres, ou un bloc de bois à 150 mètres. La mise en production de masse est prévue pour le second semestre 2026, avec un déploiement sur des modèles phares attendu entre 2027 et 2028. L'annonce repositionne Hesai sur un marché en pleine redéfinition : le passage de la voiture autonome de niveau 2+ vers le L3 exige que le LiDAR passe du statut de composant optionnel à celui de système de sécurité critique. Les architectures véhicules basculent vers des configurations multi-LiDAR (typiquement 3 à 6 capteurs pour une couverture 360°), ce qui démultiplie les volumes par véhicule. Le fait que Hesai soit aujourd'hui le seul fabricant de LiDAR à développer en interne l'intégralité de ses sept composants clés, lasers, détecteurs, drivers, TIA, ADC, DSP et contrôleurs, lui confère une autonomie verticale rare dans un secteur très dépendant des fournisseurs asiatiques de semi-conducteurs. Avec 21 puces certifiées AEC-Q, 230 millions d'unités livrées cumulées et des commandes constructeurs dépassant les 6 millions d'unités pour les seuls produits basés sur le Fermi C500 (lancé en novembre 2025 sur architecture RISC-V), Hesai présente des métriques de commercialisation réels, pas seulement des démonstrations de laboratoire. Fondée à Shanghai, Hesai a construit son écosystème chip en cinq générations de R&D. La dénomination "Picasso", référence au peintre cubiste et à sa maîtrise de la représentation multidimensionnelle, marque symboliquement le pivot stratégique de l'entreprise vers ce qu'elle appelle l'"intelligence spatiale", matérialisé par le nouveau produit Kosmo (hardware IA spatial) et une direction inédite autour de modules d'alimentation pour la robotique. Sur ce dernier segment, Hesai entre en compétition directe avec des acteurs comme Ouster (désormais Ouster-Velodyne fusionné avec Sense Photonics), Luminar, ou encore RoboSense, qui ciblent tous la robotique humanoïde et les AMR industriels. Hesai prévoit que ses livraisons cumulées dépasseront 300 millions d'unités d'ici fin 2026. Les prochaines étapes attendues concernent les homologations L3 par les constructeurs partenaires et les premières intégrations Kosmo dans des environnements de test physique AI, mais aucun client ni calendrier précis n'a été communiqué sur ces deux points.

InfrastructureActu
1 source
Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique
3Robotics & Automation News 

Lightwheel annonce 100 millions de dollars de commandes au premier trimestre pour son infrastructure de robotique à IA physique

Lightwheel, startup américaine spécialisée dans l'infrastructure pour robots physiques, annonce avoir enregistré environ 100 millions de dollars de commandes au cours du seul premier trimestre 2026. La société développe des briques logicielles dédiées à la simulation, à la génération de données synthétiques, à l'évaluation de modèles et au déploiement à l'échelle de robots pilotés par de l'intelligence artificielle physique. Le communiqué ne précise ni les clients ni les volumes unitaires concernés, ce qui limite la portée des chiffres annoncés. Ce résultat, s'il se confirme, illustre un changement de phase dans le secteur : les industriels cessent d'expérimenter et commencent à chercher des solutions d'infrastructure clé-en-main pour passer des prototypes au déploiement réel. L'infrastructure de formation, simulation haute fidélité, pipelines de données synthétiques, évaluation en boucle fermée, émerge comme un marché autonome, distinct de la fabrication des robots eux-mêmes. Pour les intégrateurs et les équipes d'automatisation, cela signifie que la question n'est plus seulement "quel robot acheter ?" mais "quelle stack d'entraînement et de qualification choisir ?". Lightwheel s'inscrit dans l'écosystème dit de la "physical AI", terme popularisé par NVIDIA avec sa plateforme Isaac et ses partenaires comme Agility Robotics, Boston Dynamics ou Figure. Ses concurrents directs sur le segment données-simulation incluent Scale AI, Synthesis AI et les stacks propriétaires que développent en interne les fabricants de robots humanoïdes. La prochaine étape à surveiller : des références clients nommées et des métriques de déploiement réel, seuls indicateurs capables de valider que la demande annoncée se traduit en robots effectivement opérationnels en production.

InfrastructureActu
1 source
Kairos : un système de déploiement extensible pour l'IA physique
4arXiv cs.RO 

Kairos : un système de déploiement extensible pour l'IA physique

Une équipe de chercheurs publie sur arXiv (référence 2605.11381, mai 2025) les spécifications de Kairos, un système d'inférence conçu pour les flottes de robots pilotées par des modèles de fondation. Kairos se positionne comme le premier système de serving multi-robot à intégrer nativement la boucle generate-execute, soit l'enchaînement asynchrone entre les phases d'inférence et d'exécution motrice propre à l'IA physique. Sur un ensemble de modèles et de plateformes robotiques, le système annonce une réduction de la latence bout-en-bout de 31,8 à 66,5 % par rapport aux pratiques de serving issues du monde de l'IA digitale, avec des gains qui s'accroissent avec la taille de la flotte déployée. L'argument central des auteurs tient à une inadéquation structurelle. Les systèmes actuels comme vLLM, TensorRT-LLM ou Triton ont été conçus pour les LLM textuels : ils traitent une requête jusqu'à complétion, sans état intermédiaire. L'IA physique fonctionne différemment : le modèle génère des blocs d'actions (action chunks) à chaque round d'inférence, le robot commence à exécuter pendant que le bloc suivant est calculé, et plusieurs cycles se succèdent sur une même tâche. Cette asynchronicité, ignorée par les serveurs digitaux classiques, crée un goulot d'étranglement critique pour les flottes industrielles. Si les chiffres se confirment en conditions réelles, les intégrateurs y gagneraient des cycles de contrôle plus courts et une capacité de scaling horizontal sans surcoût infrastructure proportionnel. Le contexte explique l'urgence de cette contribution. Depuis 2024, les modèles de fondation pour robots prolifèrent : Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA, Helix de Figure AI. Ces VLA (Vision-Language-Action) ont franchi des seuils de généralisation inédits, mais l'infrastructure de déploiement n'a pas suivi le même rythme. Kairos tente de combler ce fossé côté serving. Il s'agit néanmoins d'un preprint non revu par les pairs : les benchmarks ne sont pas détaillés dans l'abstract, les modèles et robots de test ne sont pas nommés, et aucun déploiement en production n'est déclaré. Les métriques annoncées méritent donc une lecture prudente en attendant une validation expérimentale indépendante.

InfrastructureOpinion
1 source