InfrastructureIEEE Spectrum AI2h

Un meilleur matériel peut transformer les outsiders de l'IA en acteurs majeurs

1 source couvre ce sujet·Source originale ↗·

Le dernier modèle Llama de Meta atteint les 2 000 milliards de paramètres, un chiffre vertigineux qui illustre la course effrénée au gigantisme dans l'industrie de l'IA. Mais des chercheurs de l'université de Stanford ont mis au point une puce expérimentale qui pourrait changer radicalement l'équation énergétique de ces modèles colossaux. Leur approche repose sur un phénomène connu sous le nom de sparsité : dans la plupart des grands modèles de langage, une majorité des paramètres (poids et activations) sont égaux à zéro, ou si proches de zéro qu'ils peuvent être traités comme tels sans perte de précision. L'équipe Stanford a conçu le premier accélérateur matériel capable de traiter efficacement tous les types de charges de travail sparses, en partant de zéro sur la pile complète : hardware, firmware bas niveau et logiciel applicatif. Résultat mesuré : la puce consomme en moyenne soixante-dix fois moins d'énergie qu'un CPU classique et effectue les calculs huit fois plus vite.

L'enjeu est considérable pour l'ensemble de l'industrie. Les modèles d'IA actuels exigent des ressources computationnelles et énergétiques croissantes, avec un impact carbone qui devient difficile à ignorer. Or les GPU et CPU dominants aujourd'hui n'exploitent pas naturellement la sparsité : ils multiplient et additionnent les zéros comme n'importe quel autre nombre, gaspillant du temps et de l'énergie. Sauter ces opérations inutiles et ne stocker que les paramètres non nuls permettrait, en théorie, de faire tourner des modèles de très grande taille avec une fraction de l'infrastructure actuelle, sans sacrifier leurs performances. Pour les entreprises qui déploient des modèles en production, les économies potentielles sur les coûts d'inférence seraient substantielles.

Il y a deux ans, Cerebras avait déjà démontré que l'on peut mettre à zéro jusqu'à 70 à 80 % des paramètres d'un grand modèle de langage sans perte de précision mesurable, en testant cette approche sur le Llama 7B de Meta, avec des implications étendues à des modèles comme ChatGPT ou Claude. La sparsité peut aussi être naturellement présente dans certaines architectures, comme les modèles de recommandation ou les graphes de réseaux sociaux, où la plupart des connexions possibles n'existent pas. Ce que l'équipe Stanford apporte maintenant, c'est la preuve matérielle que toute la chaîne d'exécution peut être repensée pour exploiter cette propriété. La prochaine étape sera de savoir si l'industrie, dominée par Nvidia et ses GPU denses, adoptera cette direction ou si la sparsité restera un sujet de recherche académique face à la brutalité des roadmaps de puissance brute.

💬 Le point de vue du dev

70x moins d'énergie, c'est pas un détail. Stanford prouve qu'on peut reconstruire toute la stack matérielle autour de la sparsité et obtenir des résultats qui feraient pâlir n'importe quel data center. La vraie question, c'est si Nvidia va laisser ce genre de truc décoller, ou si leurs roadmaps de puissance brute vont continuer à dicter la direction de l'industrie pendant les 10 prochaines années.

À lire aussi

1NVIDIA AI Blog

Omniverse : l'industrie manufacturière entre dans l'ère de la simulation

NVIDIA a officiellement marqué un tournant dans l'industrie manufacturière avec la maturité de sa pile technologique Physical AI, combinant OpenUSD, NVIDIA Omniverse et des modèles de simulation haute-fidélité. L'idée centrale : remplacer les cycles traditionnels de conception-fabrication-test par une approche "simulation d'abord", où des environnements virtuels physiquement précis génèrent des données d'entraînement suffisamment fiables pour déployer de l'IA en production réelle. Le standard SimReady, construit sur OpenUSD, joue ici un rôle clé : il définit ce que doit contenir un asset 3D pour fonctionner de manière cohérente à travers les pipelines de rendu, simulation et entraînement IA, sans pertes de métadonnées ou de propriétés physiques à chaque transfert. Plusieurs grandes entreprises ont déjà mis cette infrastructure à l'épreuve avec des résultats mesurables. ABB Robotics a intégré les bibliothèques Omniverse dans son environnement RobotStudio HyperReality, utilisé par plus de 60 000 ingénieurs dans le monde. En représentant les stations robotiques sous forme de fichiers USD qui tournent avec le même firmware que leurs équivalents physiques, ABB atteint désormais 99 % de précision entre simulation et réalité, selon Craig McDonnell, directeur général des industries chez ABB Robotics. Les gains opérationnels sont concrets : jusqu'à 50 % de réduction des cycles d'introduction produit, 80 % de réduction du temps de mise en service, et 30 à 40 % d'économies sur le coût total du cycle de vie des équipements. De son côté, JLR a formé des modèles neuronaux sur plus de 20 000 simulations CFD corrélées à des essais en soufflerie, 95 % des charges de travail aérothermiques tournant désormais sur GPU NVIDIA. Résultat : ce qui prenait quatre heures de simulation aérodynamique se fait maintenant en une minute. Ces résultats illustrent un changement de paradigme profond pour l'industrie lourde. La simulation haute-fidélité cesse d'être un outil de validation en fin de cycle pour devenir le terrain principal de conception et d'entraînement des systèmes d'IA. Pour les constructeurs automobiles, les intégrateurs robotiques ou les équipementiers industriels, cela signifie des lignes de production validées avant même d'exister physiquement, des délais de mise sur le marché réduits de moitié et une réduction drastique des coûts de prototypage. L'enjeu est aussi concurrentiel : les entreprises qui maîtrisent ces outils gagnent une capacité d'itération que leurs concurrents ne peuvent pas égaler avec des approches physiques traditionnelles. Ce virage s'inscrit dans la stratégie à long terme de NVIDIA pour s'imposer comme infrastructure de l'IA industrielle, au-delà des datacenters. OpenUSD, originellement développé par Pixar pour la production 3D, s'est imposé comme standard d'interopérabilité industrielle sous l'impulsion de NVIDIA et d'un écosystème croissant de partenaires. La plateforme Metropolis VSS Blueprint, sur laquelle Tulip Interface a construit son outil Factory Playback pour le fabricant d'équipements Terex, montre que la couche d'intelligence ne s'arrête pas à la simulation pre-production : elle s'étend aux usines en exploitation, fusionnant flux vidéo, capteurs machines et données opérationnelles en une chronologie unifiée des événements réels. La prochaine frontière est l'agent autonome capable d'agir en temps réel dans ces environnements, ce que NVIDIA positionne comme le prochain stade de son écosystème Omniverse.

UELes industriels européens de l'automobile et de la robotique peuvent réduire leurs délais de mise sur le marché de moitié et leurs coûts de prototypage en adoptant la stack de simulation physique NVIDIA Omniverse, déjà déployée par des acteurs comme ABB (Suisse) et JLR (Royaume-Uni).

InfrastructureActu

1 source

2AI News

Lightelligence bondit de 400% en bourse, pari sur l'interconnexion optique comme prochain goulot d'étranglement de l'IA

Lightelligence, fabricant chinois de puces photoniques basé à Shanghai, a fait une entrée fracassante à la Bourse de Hong Kong mardi, avec un cours qui a bondi de près de 400% dès le premier jour de cotation. L'action a ouvert à 882 HK$ contre un prix d'introduction de 183,2 HK$, le haut de la fourchette initiale. L'entreprise a levé 2,4 milliards HK$ (environ 310 millions de dollars) lors de son IPO, dont la tranche grand public a été sursouscrite près de 5 785 fois. Première entreprise de photonique continentale à s'introduire à Hong Kong, Lightelligence affiche 106 millions de RMB (15,5 millions de dollars) de chiffre d'affaires annuel en 2025, pour une capitalisation boursière qui a brièvement atteint 10 milliards de dollars. Son produit phare, LightSphere X, est présenté comme la première solution de commutation optique distribuée pour les interconnexions de supernœuds GPU, capable d'augmenter l'utilisation des FLOPS de plus de 50% tout en réduisant le coût total d'exploitation. Au 31 mars 2026, la société détenait 410 brevets et revendiquait 88,3% de parts de marché parmi les fournisseurs indépendants en Chine pour les interconnexions optiques à l'échelle des nœuds de calcul haute performance. L'engouement des investisseurs repose sur une conviction croissante : le câblage en cuivre entre les puces d'intelligence artificielle est en train de devenir le prochain goulet d'étranglement des infrastructures d'IA. Les grands clusters de GPU, nécessaires pour entraîner et faire tourner les grands modèles de langage, transfèrent des volumes de données colossaux entre les puces. Le cuivre génère de la chaleur, consomme beaucoup d'énergie et atteint ses limites en termes de débit sur de courtes distances. L'interconnexion optique, qui remplace les signaux électriques par de la lumière, offre une latence réduite, une bande passante plus élevée et une meilleure efficacité énergétique. Pour les opérateurs de datacenters et les fournisseurs cloud qui cherchent à optimiser leurs coûts à mesure que les clusters d'IA grossissent, cette technologie représente une rupture potentiellement structurelle. Lightelligence évolue néanmoins dans un contexte financier tendu. Ses pertes nettes ont atteint 1,34 milliard de RMB en 2025, et son ratio actif-passif s'établit à 473%, ce qui signifie que ses dettes dépassent largement ses actifs. Un seul client représente 40,6% de son chiffre d'affaires. Dans le marché global chinois, Huawei reste dominant avec 98,4% de parts, Lightelligence n'en détenant que 8,3% en tant que premier fournisseur tiers indépendant. Malgré ces signaux d'alerte, le tour de table des investisseurs cornerstone est impressionnant : Alibaba, GIC, Temasek, BlackRock, Fidelity, Schroders, Hillhouse Capital, Lenovo et ZTE ont tous participé. La croissance annuelle composée du chiffre d'affaires atteint 66,9% sur deux ans, et le secteur de l'informatique photonique, encore largement peuplé de startups pré-revenus, laisse une fenêtre d'opportunité à qui peut prouver une commercialisation à grande échelle.

InfrastructureActu

1 source

3SCMP Tech

Lightelligence bondit de 400 % à son introduction en Bourse à Hong Kong, portée par la demande en puces photoniques liée à l'IA

Lightelligence, premier fabricant chinois de puces photoniques à s'introduire en bourse à Hong Kong, a vu son cours s'envoler de près de 400 % lors de ses débuts en séance le mardi 28 avril 2026. La société basée à Shanghai a ouvert à 880 dollars de Hong Kong, soit près de cinq fois son prix d'introduction fixé à 183,2 HK$, le plafond de sa fourchette indicative de 166,6 à 183,2 HK$. L'opération lui a permis de lever 2,4 milliards de dollars de Hong Kong (environ 310 millions de dollars américains). Cette performance spectaculaire reflète l'appétit croissant des investisseurs pour les alternatives aux semi-conducteurs électroniques classiques dans le domaine de l'intelligence artificielle. Les puces photoniques, qui exploitent la lumière plutôt que les électrons pour transmettre et traiter les données, promettent des gains significatifs en vitesse et en efficacité énergétique pour les centres de données IA, un marché en expansion rapide. Pour la Chine, qui cherche à réduire sa dépendance aux technologies de semiconducteurs occidentaux sous pression des restrictions américaines à l'exportation, le développement d'une filière photonique nationale représente un enjeu stratégique majeur. L'introduction en bourse de Lightelligence s'inscrit dans un contexte de course mondiale aux infrastructures IA, où les limites physiques des architectures électroniques traditionnelles alimentent l'intérêt pour de nouvelles approches. La Chine, confrontée aux restrictions sur les puces Nvidia haut de gamme, investit massivement dans des technologies alternatives. La photonique figure parmi les pistes les plus prometteuses, et la valorisation boursière de Lightelligence envoie un signal fort à l'ensemble de l'écosystème de startups qui travaillent sur ces architectures de rupture.

UEL'essor des puces photoniques chinoises comme alternative aux semi-conducteurs électroniques interpelle les initiatives européennes de souveraineté technologique, notamment dans le cadre des investissements du Chips Act UE.

InfrastructureActu

1 source

4Le Big Data

Minisforum : comment l’expert du mini-PC est devenu l’architecte de l’IA locale

Fondée en 2012 à Shenzhen sous le nom BESTSTAR TECH, la société qui allait devenir Minisforum a d'abord opéré dans l'ombre comme fabricant OEM, produisant des mini-PC pour des marques tierces comme Kodlix. Son virage grand public intervient en 2019, date à laquelle elle lance sa propre marque et affronte directement la concurrence mondiale. Depuis, l'entreprise a noué des partenariats stratégiques avec Intel et AMD pour accéder aux puces les plus récentes, et elle a progressivement repoussé les limites du format compact. Aujourd'hui, son catalogue s'articule autour de machines capables d'embarquer des processeurs de bureau dans des boîtiers de quelques litres, avec des connectiques haut de gamme comme l'OCuLink et l'USB4 v2. Le modèle phare de cette trajectoire est la MS-02 Ultra, distinguée par une médaille d'or aux CES 2026 Innovation Awards : ce châssis de seulement 4,8 litres accueille un processeur Core Ultra 9 285HX, jusqu'à 256 Go de DDR5 ECC, un port PCIe 5.0 x16 compatible avec des GPU dual-slot comme la RTX 5070, et un système de refroidissement à six caloducs pour absorber un TDP total de 240 W sans aucun bridage thermique. Cette montée en puissance n'est pas anodine. Elle répond à une demande croissante de professionnels et d'indépendants qui souhaitent faire tourner des charges de travail lourdes, virtualisation sous Proxmox, rendu 3D sous Blender, serveurs d'entreprise ou création vidéo en 16K, sans recourir à des tours encombrantes ni à des infrastructures cloud coûteuses. Avec plus de quatre millions d'utilisateurs revendiqués, Minisforum s'est imposé comme une référence dans un segment longtemps perçu comme secondaire. La station MS-02 Ultra casse définitivement le préjugé selon lequel la compacité implique un compromis sur la puissance brute. Le tournant le plus structurant reste cependant l'Edge AI. Jusqu'ici, les applications d'intelligence artificielle dépendaient de serveurs distants, ce qui entraînait des latences élevées et des risques réels pour la confidentialité des données. En 2026, les nouvelles générations de puces embarquent des NPU atteignant 86 TOPS, capables de traiter des modèles complexes en moins de 10 millisecondes directement en local, sans connexion cloud. Minisforum se positionne à l'avant-garde de cette bascule : ses appareils permettent de faire tourner des LLMs ou des pipelines d'inférence sur du matériel personnel, réduisant à la fois la dépendance aux infrastructures tierces et l'exposition des données sensibles. Ce mouvement vers l'IA embarquée redéfinit ce qu'un particulier ou une PME peut accomplir avec une machine tenant sur un bureau.

UEL'essor de l'IA locale embarquée sur mini-PC répond aux exigences de souveraineté des données imposées par le RGPD, permettant aux PME et indépendants européens de traiter des données sensibles sans dépendre du cloud américain.

InfrastructureOpinion

1 source