
GTC met en avant les PC NVIDIA RTX et DGX Sparks pour faire tourner les derniers modèles open source et agents IA en local
NVIDIA franchit une nouvelle étape dans la démocratisation de l'IA générative en faisant de l'ordinateur personnel un véritable supercalculateur d'agents autonomes. À l'occasion de la conférence GTC, qui se tient cette semaine, le géant des semi-conducteurs a dévoilé une série d'annonces majeures autour des PC RTX et du DGX Spark, positionnant ces machines comme la nouvelle génération d'« ordinateurs agents » — capables de faire tourner des assistants IA puissants en local, sans cloud et sans abonnement.
L'enjeu est de taille : en rapatriant l'inférence sur le matériel local, NVIDIA répond à une demande croissante de confidentialité et de souveraineté numérique. Les utilisateurs peuvent désormais déployer des agents conversationnels avancés directement sur leur machine, sans transmettre leurs données à des serveurs tiers. Ce positionnement concurrence frontalement les offres cloud des grands acteurs tout en s'appuyant sur l'écosystème déjà établi d'outils comme Ollama, LM Studio et llama.cpp.
Sur le plan technique, les annonces sont concrètes. Le modèle Nemotron 3 Super — 120 milliards de paramètres, dont 12 milliards actifs — affiche un score de 85,6 % sur le benchmark PinchBench, le plaçant en tête des modèles open source de sa catégorie. Le Mistral Small 4 (119 milliards de paramètres, 6 milliards actifs) cible quant à lui les tâches de chat, de code et d'usage agentique. Pour les configurations plus modestes, le Nemotron 3 Nano 4B offre un point d'entrée léger, optimisé pour les jeux et applications à ressources limitées. NVIDIA annonce également des optimisations pour les modèles Qwen 3.5 d'Alibaba (27B, 9B et 4B), dotés d'une fenêtre de contexte de 262 000 tokens et d'un support natif de la vision.
Ces lancements s'accompagnent d'outils destinés à faciliter l'adoption : NVIDIA NemoClaw, une stack open source pour optimiser les expériences agentiques sur GPU NVIDIA, et Unsloth Studio pour le fine-tuning simplifié des modèles locaux. Le DGX Spark, avec ses 128 Go de mémoire unifiée, s'impose comme la plateforme de référence pour faire tourner les modèles les plus lourds — une proposition qui s'adresse autant aux développeurs professionnels qu'aux passionnés souhaitant s'affranchir du cloud.
Mistral Small 4, développé par la startup française Mistral AI, est mis en avant comme modèle phare pour les agents IA locaux sur les appareils NVIDIA, renforçant la visibilité d'un acteur européen face aux géants américains.


