Aller au contenu principal
Entretien avec Yuhnzu Li, professeur à Columbia et cofondateur de SceniX : « La simulation est centrale »
InfrastructureRobotics & Automation News2h

Entretien avec Yuhnzu Li, professeur à Columbia et cofondateur de SceniX : « La simulation est centrale »

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Yuhnzu Li, professeur à l'Université Columbia et co-fondateur de SceniX, défend une thèse tranchée dans un secteur en pleine effervescence : la simulation est la clé de voûte du développement robotique moderne, pas un outil auxiliaire. L'entretien intervient alors que l'industrie humanoïde accumule les annonces de production à grande échelle et que l'IA générative nourrit des attentes parfois déconnectées du terrain. Li, chercheur ancré dans la robotique fondamentale, rappelle que les démonstrations publiques reflètent rarement la robustesse opérationnelle réelle des systèmes.

Le positionnement de SceniX éclaire un enjeu industriel concret : le sim-to-real gap, c'est-à-dire l'écart de performance entre un robot entraîné en simulation et ce même robot déployé en environnement physique non contrôlé. Résoudre ce gap est devenu le problème n°1 des équipes qui développent des politiques de contrôle visuomotrices (VLA), car générer suffisamment de données réelles reste coûteux et lent. Une simulation de haute fidélité permet de produire des millions d'épisodes d'entraînement que l'on ne pourrait pas collecter physiquement à coût raisonnable, ce qui conditionne directement la vitesse de commercialisation.

SceniX émerge dans un marché des outils de simulation robotique de plus en plus disputé : Isaac Sim de NVIDIA, MuJoCo maintenu par DeepMind/Google, Genesis ou encore le récent projet Cosmos d'NVIDIA ciblent le même besoin. L'ancrage académique de Li à Columbia lui confère une crédibilité sur la rigueur méthodologique, là où les acteurs commerciaux sont davantage jugés sur leurs benchmarks. La prochaine étape logique pour SceniX sera de démontrer que ses environnements synthétiques tiennent leurs promesses sur des robots en production réelle, pas seulement en laboratoire.

Dans nos dossiers

À lire aussi

NVIDIA Isaac Sim : une simulation GPU accélérée et évolutive pour la robotique
1arXiv cs.RO 

NVIDIA Isaac Sim : une simulation GPU accélérée et évolutive pour la robotique

NVIDIA Isaac Sim s'est imposé comme une infrastructure centrale dans la recherche en robotique, et une étude de synthèse publiée sur arXiv (réf. 2606.03551) en propose la première analyse systématique. Contrairement aux simulateurs classiques comme Gazebo, PyBullet ou MuJoCo, Isaac Sim exploite l'accélération GPU pour permettre un entraînement parallèle à grande échelle et une modélisation physique haute fidélité. La plateforme intègre un pipeline de génération de données synthétiques qui pallie la rareté chronique des données d'entraînement de qualité, un verrou majeur pour le robot learning. Les auteurs analysent des études représentatives dans cinq grands domaines d'application et documentent les patterns d'usage dominants, notamment la génération de données et la simulation haute fidélité, sans se limiter à une liste de fonctionnalités marketing. L'enjeu industriel est significatif : la capacité à générer des données synthétiques crédibles et à entraîner des politiques en simulation massivement parallèle est aujourd'hui au coeur du débat sur le sim-to-real transfer. Pour les intégrateurs et les équipes R&D, une plateforme qui réduit le besoin de données réelles et compresse les cycles d'itération représente un avantage compétitif concret. Les auteurs pointent également les limites : la dépendance au matériel NVIDIA (GPU haut de gamme requis), des contraintes d'utilisabilité pratique, et des questions ouvertes autour de l'apprentissage en environnement ouvert (open-world learning), un domaine où aucun simulateur n'a encore apporté de réponse satisfaisante à l'échelle. Isaac Sim s'inscrit dans la stratégie plus large de NVIDIA dans la robotique, qui comprend le framework Isaac Lab, les modèles de fondation GR00T, et l'écosystème Omniverse. Face à lui, des alternatives open-source comme MuJoCo (DeepMind) ou Genesis gagnent du terrain, notamment pour leur accessibilité. L'étude identifie trois directions futures prioritaires : l'apprentissage physique en monde ouvert, les pipelines d'entraînement centrés sur la simulation, et la réduction des frictions d'adoption. Ces axes correspondent précisément aux blocages actuels pour industrialiser le déploiement de robots apprenants en dehors des labs.

UELes équipes R&D et laboratoires européens en robotique peuvent s'appuyer sur cette première analyse systématique pour arbitrer entre Isaac Sim et les alternatives open-source (MuJoCo, Genesis), notamment au regard de la dépendance au matériel NVIDIA haut de gamme.

InfrastructureOpinion
1 source
Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique
2Pandaily 

Lightwheel AI lève un nouveau tour de table pour développer son infrastructure de données et de simulation pour l'IA physique

Lightwheel AI, startup pékinoise spécialisée dans l'infrastructure de données et de simulation pour l'IA physique, vient de boucler un nouveau tour de financement dont le montant n'a pas été divulgué. Les fonds seront affectés à trois axes : élargir les capacités de livraison, accélérer l'expansion internationale, et renforcer les partenariats avec des fabricants de robots, des développeurs de véhicules autonomes et des industriels. La société propose un triptyque de services : génération de données d'entraînement synthétiques haute qualité, environnements de simulation pour l'entraînement de modèles, et frameworks d'évaluation et de vérification. Son positionnement repose sur une boucle fermée couvrant la collecte terrain, le développement de simulateurs, l'évaluation et le déploiement en production. La technologie centrale est une approche propriétaire baptisée "calibration sur données réelles + amplification par simulation" : des données capteurs réelles servent de base de calibration, puis la simulation génère des jeux de données synthétiques à grande échelle qui reproduisent les propriétés statistiques du réel tout en étendant la couverture des cas limites et scénarios rares. Ce tour illustre une conviction croissante dans le secteur : avant d'entraîner des robots ou des VLA (Vision-Language-Action models) performants, il faut disposer d'une infrastructure de données robuste et reproductible. La plupart des acteurs de l'IA physique butent aujourd'hui sur le "sim-to-real gap" et sur le coût prohibitif de la collecte de données en environnement réel. Une approche de type "real data calibration + sim amplification" vise précisément à réduire ce coût tout en préservant la validité statistique des données, un défi technique non trivial. Si la méthode s'avère scalable, elle pourrait raccourcir significativement les cycles de développement pour les intégrateurs robotiques et réduire la dépendance aux flottes de collecte physique, aujourd'hui l'un des postes de coût les plus lourds du secteur. Matrix Partners China avait déjà mené le tour Pre-A de Lightwheel en décembre 2023, puis sursouscrit le Pre-A+ suivant, s'établissant comme principal investisseur institutionnel de la société. Ce suivi répété est un signal fort, dans un contexte où l'écosystème de l'IA physique chinois s'organise rapidement autour de couches d'infrastructure distinctes : données, simulation, fondation model, application. Les concurrents directs sur ce segment incluent des acteurs comme Scale AI ou Rendered.ai côté occidental, et plusieurs startups chinoises moins visibles à l'international. Le managing partner Tong Ti a déclaré que 2025-2026 marque "l'année du déploiement à l'échelle" pour l'IA physique, ce qui reste un cadrage marketing à surveiller : le passage de la démonstration au déploiement industriel réel, surtout dans la robotique humanoïde, prend systématiquement plus de temps qu'annoncé. Aucun client nommé, aucun volume de données chiffré, aucun site de déploiement mentionné dans le communiqué, ce qui limite pour l'instant l'évaluation indépendante des affirmations techniques.

InfrastructureActu
1 source
L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL
3Robotics Business Review 

L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL

La connectivité vision dans les systèmes robotiques traverse une mutation structurelle. Pendant près d'une décennie, les intégrateurs ont déployé des caméras USB ou Ethernet (protocole GigE Vision) pour alimenter les pipelines de perception des robots. L'USB, bon marché et universellement supporté, suffisait au prototypage, mais ses contraintes de longueur de câble, sa latence non déterministe et sa charge CPU élevée l'ont rendu inadapté aux plateformes complexes. GigE Vision a ensuite étendu la portée et standardisé les interfaces entre fournisseurs, au prix d'un processeur embarqué sur chaque caméra pour packetiser les données, ajoutant latence et complexité réseau. Aujourd'hui, le GMSL (Gigabit Multimedia Serial Link), conçu initialement pour les systèmes caméra de l'automobile, s'impose comme alternative de référence dans les architectures robotiques de nouvelle génération. Ce standard transmet des images non compressées, un contrôle bidirectionnel et l'alimentation électrique sur un unique câble coaxial ou paire torsadée blindée, sur plusieurs mètres de portée, adapté aux plateformes mobiles et articulées. La tendance est claire : les robots modernes embarquent désormais huit capteurs d'images ou plus, répartis sur l'ensemble de la structure, pour des fonctions allant de l'évitement d'obstacles à la manipulation dextre et à l'interaction humain-robot. L'enjeu pour les intégrateurs et décideurs B2B est celui du déterminisme. Les systèmes USB et Ethernet souffrent d'arbitrage et de buffering qui introduisent une variabilité de latence incompatible avec la perception temps réel : boucles de contrôle pour la manipulation, fusion LiDAR-IMU-caméra, vision stéréo synchronisée. GMSL établit une liaison point-à-point dédiée par caméra vers un calculateur centralisé (GPU embarqué ou FPGA), éliminant ces aléas. C'est un changement d'architecture, pas simplement d'interface : le traitement migre vers un noeud central unique plutôt que d'être fragmenté sur chaque caméra. Pour les plateformes qui doivent fusionner données RGB, LiDAR, radar et IMU avec une synchronisation stricte - typiquement les humanoïdes et les AMR de nouvelle génération - ce déterminisme est une exigence fonctionnelle, pas un confort. Le GMSL est issu de l'industrie automobile, où Analog Devices (ADI), principal promoteur de la technologie, l'a développé pour répondre aux exigences des systèmes ADAS et de conduite autonome : robustesse électromagnétique, temps réel, longues portées de câble. Ce transfert technologique auto-vers-robotique s'inscrit dans une dynamique plus large du secteur, où plusieurs standards automotive (Ethernet TSN, MIPI CSI-2) trouvent des débouchés dans les plateformes robotiques. ADI n'est pas seul sur ce créneau : Texas Instruments et NVIDIA proposent leurs propres écosystèmes de connectivité vision pour la robotique, et le choix d'interface reste un facteur de différenciation dans les appels d'offres industriels. À noter que l'article source est publié par ADI lui-même, ce qui invite à lire les métriques comparatives avec le recul habituel vis-à-vis des communications techniques de fournisseurs. La prochaine étape du secteur sera probablement la standardisation : des consortiums comme MIPI Alliance travaillent à harmoniser les interfaces caméra pour faciliter l'interopérabilité entre fournisseurs de capteurs, de calculateurs et intégrateurs robot.

UELes intégrateurs robotiques européens peuvent être amenés à intégrer le GMSL dans leurs cahiers des charges pour les nouvelles plateformes, mais aucun acteur ou réglementation FR/EU n'est directement impliqué.

InfrastructureActu
1 source
Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA
4Robotics Business Review 

Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA

Brian Gerkey, co-fondateur d'Open Robotics et actuel directeur technique d'Intrinsic, filiale d'Alphabet dédiée aux logiciels robotiques, prendra la parole le mercredi 28 mai 2026 à 9h00 ET lors du Robotics Summit & Expo de Boston, au Thomas M. Menino Convention & Exhibition Center (salle 253 ABC). Sa conférence, intitulée "An Open Foundation for the Age of AI-Powered Robots", présentera la stratégie de l'Open Source Robotics Alliance (OSRA) en matière d'accessibilité, d'outillage moderne et de sécurité fonctionnelle. Open Robotics, organisation qui maintient le Robot Operating System (ROS) et le simulateur Gazebo, y défendra la thèse que l'open source devient une infrastructure critique à mesure que l'IA physique accélère. La session remplace une conférence initialement prévue avec Russ Tedrake, professeur au MIT et ex-vice-président senior pour les large behavior models au Toyota Research Institute. L'événement rassemble cette année plus de 70 intervenants confirmés issus d'Amazon Robotics, AWS, Tesla, Universal Robots, Brain Corp, PickNik Robotics et Robust AI, avec plus de 50 sessions réparties sur des tracks IA, design, healthcare et logistique. Le signal est moins technique qu'institutionnel. L'émergence des architectures Vision-Language-Action (VLA), des pipelines sim-to-real et des foundation models pour la robotique physique rend la standardisation des middlewares plus stratégique que jamais. ROS 2, qui reste la référence pour la communication inter-processus sur les plateformes industrielles et humanoïdes, est maintenu collectivement via l'OSRA. Pour les intégrateurs et les équipes R&D, le fait que Gerkey articule une roadmap publique au principal salon technique commercial américain de robotique signale que l'OSRA entend jouer un rôle normatif, pas seulement communautaire. La question non résolue est celle de la performance : les pipelines d'inférence GPU modernes imposent des contraintes de latence que les architectures ROS classiques gèrent mal, et c'est précisément là que se jouera la crédibilité du discours. Open Robotics a été fondée en 2012 autour de ROS, né à Willow Garage, l'un des premiers labs à industrialiser la recherche robotique aux États-Unis. Gerkey y a travaillé avant de co-fonder l'organisation, et son rattachement actuel à Intrinsic place cette prise de parole à l'intersection de la stratégie Google/Alphabet et de la gouvernance open source. Sur le plan concurrentiel, l'écosystème ROS fait face à des alternatives propriétaires croissantes : Isaac ROS de NVIDIA, les middlewares maison de Boston Dynamics ou de Figure AI, et des frameworks applicatifs comme LeRobot de HuggingFace. La prochaine étape pour l'OSRA sera de démontrer comment ROS 2 s'intègre nativement avec des architectures de foundation models en production, un point que Gerkey devrait adresser lors de sa session du 28 mai.

UEROS 2 étant la référence middleware adoptée par la majorité des équipes robotiques européennes, la roadmap OSRA articulée par Gerkey influencera les choix d'architecture pour les intégrateurs et startups FR/EU développant des robots à base de foundation models.

InfrastructureOpinion
1 source