Aller au contenu principal
InfrastructurearXiv cs.RO2h

ROSA : un système d'inférence de modèles fondation pour usines de robots

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de recherche propose ROSA, un système de service d'inférence pour les modèles fondation de robotique (RFM), décrit dans un preprint publié sur arXiv (2607.01088, 1er juillet 2026). Contrairement aux systèmes existants qui traitent l'inférence comme un problème de calcul en périphérie, avec un GPU embarqué ou dédié par robot, ROSA repose sur trois principes: un pool de GPU partagé accessible en réseau par toute une flotte de robots, une abstraction de programmation "robotics-aware" gérant des pipelines multi-modèles avec exigences de performance par tâche et gestion des échecs, et un ordonnancement piloté par l'objectif global de l'usine plutôt que par la latence d'une seule requête. L'équipe l'a implémenté sur Ray Serve pour l'orchestration distribuée, avec vLLM, PyTorch et JAX comme moteurs d'inférence, et l'a évalué sur des robots réels ainsi que sur des charges de travail synthétiques à grande échelle. Résultat annoncé: jusqu'à 12,06 fois plus de productivité d'usine qu'avec des systèmes de service dédiés classiques, un chiffre qui reste à confirmer sur des déploiements industriels réels plutôt que sur les scénarios de test choisis par les auteurs.

L'intérêt de ROSA est de remettre en cause l'hypothèse dominante selon laquelle l'inférence d'un modèle de robot doit tourner localement, robot par robot. En mutualisant des GPU de classe serveur sur le réseau, l'approche promet de meilleures performances d'inférence, une autonomie de batterie accrue et un taux d'utilisation GPU plus élevé, des enjeux critiques pour les industriels qui envisagent des flottes de robots humanoïdes ou mobiles plutôt que des unités isolées. Cela rapproche l'infrastructure de service robotique du modèle déjà adopté pour les grands modèles de langage en cloud, un signal utile pour les intégrateurs et décideurs qui raisonnent en coût par flotte plutôt qu'en coût par robot.

Le travail s'inscrit dans la vague plus large des modèles fondation de robotique (VLA) qui rendent les robots généralistes envisageables en usine, où l'inférence reste souvent le goulot d'étranglement plutôt que l'apprentissage lui-même. Il s'agit ici d'une contribution académique, pas d'un produit commercialisé: aucun acteur français ou européen n'est cité, et le passage à l'échelle en production reste à démontrer au-delà des bancs d'essai présentés.

Dans nos dossiers

À lire aussi

La convergence des systèmes de perception, de l'automobile aux robots
1Robotics Business Review 

La convergence des systèmes de perception, de l'automobile aux robots

Une nouvelle génération de robots mobiles - AMR en entrepôts et hôpitaux, drones à longue autonomie, humanoïdes opérant aux côtés des humains - exige désormais des architectures de perception radicalement différentes de celles des décennies précédentes. Là où les capteurs jouaient autrefois un rôle secondaire dans le contrôle, ils constituent aujourd'hui l'entrée principale : la vision haute résolution guide la navigation et la manipulation dextère, le traitement audio multi-microphones permet la localisation sonore et l'interaction vocale, tandis que les capteurs de force et de toucher affinent la préhension et l'équilibre. Ces modalités doivent être synchronisées en temps réel pour alimenter la fusion sensorielle et les boucles de contrôle fermées. Le vrai défi n'est plus de concevoir un capteur isolé ou un modèle autonome, mais de faire fonctionner ensemble, de manière fiable, la perception, la connectivité, le calcul, l'énergie et la sécurité dans des environnements imprévisibles. Ce défi est précisément celui qu'a résolu l'industrie automobile en traitant le véhicule comme un système nerveux distribué : un réseau intégré de capteurs, de processeurs embarqués, de liaisons de communication et d'éléments de contrôle, conçu pour se comporter de façon prévisible dans des conditions réelles. La robotique converge aujourd'hui vers ce même modèle architectural. Pour les intégrateurs et les décideurs industriels, les implications sont concrètes : les données doivent arriver rapidement et de façon déterministe, les capteurs sont physiquement distribués à travers des articulations mobiles ou de longs câbles, et les défaillances doivent être détectables et localisables en temps réel. Les plateformes qui manquent d'observabilité sur l'intégrité des capteurs ou l'état énergétique deviennent de plus en plus fragiles à mesure que leur complexité augmente, rallongeant les cycles de débogage et rendant les déploiements terrain coûteux. A contrario, une architecture conçue avec des diagnostics embarqués et une connectivité déterministe réduit l'incertitude et transforme la sécurité en accélérateur d'itération plutôt qu'en contrainte. Analog Devices (ADI), fabricant de semi-conducteurs à l'interface des marchés automobile et des nouvelles mobilités, signe cette analyse pour promouvoir le transfert de ses technologies automotive-grade vers la robotique et les drones - un parti pris commercial qu'il convient de garder à l'esprit. Ces composants ont été développés sous des contraintes sévères : conditions électriques difficiles, enveloppes thermiques étroites, durées de vie longues et tolérance zéro aux défaillances silencieuses. Des liaisons vision haute bande passante et faible latence permettent, par exemple, la perception multi-caméra sur de grandes structures robotiques, tandis que des réseaux audio déterministes supportent la localisation sonore et l'interaction naturelle avec les humains. ADI se positionne ainsi face à NVIDIA (Jetson, Isaac), Qualcomm et Texas Instruments dans la fourniture de briques de traitement embarqué pour robots et drones. L'article ne cite aucun déploiement en volume ni chiffre de performance concret - il relève davantage du positionnement stratégique que du retour terrain, et les prochaines étapes évoquées restent au stade des perspectives génériques.

InfrastructureActu
1 source
ORICF : un framework ouvert pour l'inférence et le contrôle en robotique
2arXiv cs.RO 

ORICF : un framework ouvert pour l'inférence et le contrôle en robotique

Des chercheurs ont publié le 12 mai 2026 sur arXiv (identifiant 2605.09656v1) un framework open source baptisé ORICF (Open Robotics Inference and Control Framework), conçu pour réduire le coût computationnel du déploiement de modèles d'IA sur robots mobiles. La plateforme, modulaire et agnostique aux modèles, permet de composer des pipelines d'inférence multimodaux via de simples fichiers de configuration YAML, sans modification du code source. Son mécanisme central, l'edge offloading, consiste à délocaliser les tâches d'inférence vers des machines externes proches du robot plutôt que de les exécuter en embarqué. Validé sur un robot mobile équipé de ROS2, le système combinait reconnaissance automatique de la parole (ASR), un grand modèle de langage (LLM) et un réseau de neurones convolutif (CNN) pour répondre à des questions orales sur les personnes détectées par sa caméra. Par rapport à une exécution entièrement embarquée, ORICF réduit l'utilisation des ressources de calcul côté robot de 83,16% et la consommation énergétique estimée de 65,8%, tout en préservant la modularité et la reproductibilité du pipeline. Ces résultats adressent l'un des freins les plus concrets au déploiement de modèles fondamentaux sur robots de service ou industriels : la contrainte matérielle embarquée. En déchargeant dynamiquement l'inférence sur des serveurs edge locaux ou des postes de travail voisins, ORICF rend envisageable l'utilisation de modèles lourds (LLM, VLM) sur plateformes à faible puissance de calcul. La spécification déclarative YAML simplifie également les changements de modèles ou de cibles matérielles, avantage concret pour les équipes intégration qui gèrent plusieurs configurations de déploiement. À noter cependant : la validation ne porte que sur un prototype unique en laboratoire, et les métriques de latence de bout en bout en conditions réelles ne sont pas détaillées dans le preprint, ce qui limite l'extrapolation aux environnements industriels. ORICF s'inscrit dans un mouvement plus large d'outillage de la robotique embarquée avec des modèles fondamentaux, alors que ROS2 s'est imposé comme infrastructure standard pour les robots de recherche et de plus en plus industriels. Plusieurs approches concurrentes ciblent le même problème : Isaac ROS de NVIDIA propose une pile d'inférence optimisée pour hardware Jetson, tandis que des acteurs comme Hailo adressent le déploiement sur puces dédiées. Le preprint ne cite pas d'affiliation universitaire ni d'entreprise sponsor visible, ce qui reste un signal à surveiller pour évaluer la maturité et la continuité du projet. Les prochaines étapes logiques seraient une validation sur des plateformes robotiques hétérogènes et une évaluation de latence en conditions opérationnelles réelles.

InfrastructureOpinion
1 source
Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA
3Robotics Business Review 

Robotics Summit : le discours d'ouverture présente une fondation ouverte pour les robots à base d'IA

Brian Gerkey, co-fondateur d'Open Robotics et actuel directeur technique d'Intrinsic, filiale d'Alphabet dédiée aux logiciels robotiques, prendra la parole le mercredi 28 mai 2026 à 9h00 ET lors du Robotics Summit & Expo de Boston, au Thomas M. Menino Convention & Exhibition Center (salle 253 ABC). Sa conférence, intitulée "An Open Foundation for the Age of AI-Powered Robots", présentera la stratégie de l'Open Source Robotics Alliance (OSRA) en matière d'accessibilité, d'outillage moderne et de sécurité fonctionnelle. Open Robotics, organisation qui maintient le Robot Operating System (ROS) et le simulateur Gazebo, y défendra la thèse que l'open source devient une infrastructure critique à mesure que l'IA physique accélère. La session remplace une conférence initialement prévue avec Russ Tedrake, professeur au MIT et ex-vice-président senior pour les large behavior models au Toyota Research Institute. L'événement rassemble cette année plus de 70 intervenants confirmés issus d'Amazon Robotics, AWS, Tesla, Universal Robots, Brain Corp, PickNik Robotics et Robust AI, avec plus de 50 sessions réparties sur des tracks IA, design, healthcare et logistique. Le signal est moins technique qu'institutionnel. L'émergence des architectures Vision-Language-Action (VLA), des pipelines sim-to-real et des foundation models pour la robotique physique rend la standardisation des middlewares plus stratégique que jamais. ROS 2, qui reste la référence pour la communication inter-processus sur les plateformes industrielles et humanoïdes, est maintenu collectivement via l'OSRA. Pour les intégrateurs et les équipes R&D, le fait que Gerkey articule une roadmap publique au principal salon technique commercial américain de robotique signale que l'OSRA entend jouer un rôle normatif, pas seulement communautaire. La question non résolue est celle de la performance : les pipelines d'inférence GPU modernes imposent des contraintes de latence que les architectures ROS classiques gèrent mal, et c'est précisément là que se jouera la crédibilité du discours. Open Robotics a été fondée en 2012 autour de ROS, né à Willow Garage, l'un des premiers labs à industrialiser la recherche robotique aux États-Unis. Gerkey y a travaillé avant de co-fonder l'organisation, et son rattachement actuel à Intrinsic place cette prise de parole à l'intersection de la stratégie Google/Alphabet et de la gouvernance open source. Sur le plan concurrentiel, l'écosystème ROS fait face à des alternatives propriétaires croissantes : Isaac ROS de NVIDIA, les middlewares maison de Boston Dynamics ou de Figure AI, et des frameworks applicatifs comme LeRobot de HuggingFace. La prochaine étape pour l'OSRA sera de démontrer comment ROS 2 s'intègre nativement avec des architectures de foundation models en production, un point que Gerkey devrait adresser lors de sa session du 28 mai.

UEROS 2 étant la référence middleware adoptée par la majorité des équipes robotiques européennes, la roadmap OSRA articulée par Gerkey influencera les choix d'architecture pour les intégrateurs et startups FR/EU développant des robots à base de foundation models.

InfrastructureOpinion
1 source
NVIDIA lance Halos, un système de sécurité complet pour la robotique
4Robotics Business Review 

NVIDIA lance Halos, un système de sécurité complet pour la robotique

NVIDIA a lancé Halos for Robotics, un système de sécurité à pile complète pour la robotique industrielle et l'IA physique. Premier intégrateur officiel : Agility Robotics, dont les humanoïdes opèrent en entrepôts et usines pour Amazon, GXO, Schaeffler et Toyota Motor Manufacturing Canada. L'architecture couvre trois couches : la plateforme de calcul NVIDIA IGX Thor avec le Holoscan Sensor Bridge pour la connectivité capteurs en temps réel ; Halos OS incluant Halos Core ; et le Outside-In Safety Blueprint, un programme open source disponible sur GitHub qui pilote le comportement du robot via des caméras externes et des agents IA. NVIDIA revendique 18 600 années-ingénieur de développement sécurité issus de son activité véhicule autonome. L'écosystème associe des partenaires logiciels (QNX, Amazon FreeRTOS, Acontis), fabricants de systèmes embarqués (Advantech, NexCobot), fournisseurs de semi-conducteurs (Infineon, NXP, SICK, STMicroelectronics, Texas Instruments) et organismes de certification (TÜV Rheinland, TÜV SÜD, UL Solutions, exida, SGS, CertX). Halos Core est déjà certifié ISO 26262 par TÜV SÜD. Le système est disponible en early access pour les développeurs enregistrés, en configurations Linux et Linux+QNX. L'enjeu de Halos est de répondre à un problème structurel : l'absence d'architecture de sécurité standardisée pour des robots autonomes opérant aux côtés de travailleurs. Les intégrateurs composaient jusqu'ici avec des solutions hétérogènes, ce qui complexifiait la certification et freinait le passage à l'échelle. En proposant une pile unifiée du silicium à la supervision logicielle, NVIDIA cherche à s'imposer comme substrat commun de la sécurité robotique industrielle. La certification ISO 26262 de Halos Core est un signal concret : NVIDIA transfère une base éprouvée du monde AV vers la robotique, ce qui pourrait raccourcir les cycles de validation pour les intégrateurs et réduire les coûts de certification tiers. NVIDIA construit depuis plusieurs années une position dans la robotique via les plateformes Isaac, Omniverse et les modèles de fondation GR00T N2. Halos complète cette stratégie d'infrastructure : vendre le substrat computationnel et logiciel, pas les robots eux-mêmes. Les concurrents directs incluent FORT Robotics dans les solutions de sécurité embarquée (qui figure d'ailleurs parmi les partenaires Halos), ainsi que les approches propriétaires de Boston Dynamics ou Fanuc. L'annonce reste un early access sans données publiques de déploiement à grande échelle avec Halos effectivement activé. Les prochaines inspections de certification de l'IGX Thor et du Holoscan Sensor Bridge par TÜV Rheinland constitueront le vrai indicateur de maturité opérationnelle du système.

UESTMicroelectronics (France/Italie) figure parmi les partenaires semi-conducteurs de Halos, et les organismes TÜV Rheinland et TÜV SÜD (Allemagne) sont intégrés au programme de certification, ce qui peut raccourcir les cycles de validation réglementaire pour les intégrateurs robotiques européens.

InfrastructureOpinion
1 source