Aller au contenu principal
ORICF : un framework ouvert pour l'inférence et le contrôle en robotique
InfrastructurearXiv cs.RO6sem

ORICF : un framework ouvert pour l'inférence et le contrôle en robotique

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié le 12 mai 2026 sur arXiv (identifiant 2605.09656v1) un framework open source baptisé ORICF (Open Robotics Inference and Control Framework), conçu pour réduire le coût computationnel du déploiement de modèles d'IA sur robots mobiles. La plateforme, modulaire et agnostique aux modèles, permet de composer des pipelines d'inférence multimodaux via de simples fichiers de configuration YAML, sans modification du code source. Son mécanisme central, l'edge offloading, consiste à délocaliser les tâches d'inférence vers des machines externes proches du robot plutôt que de les exécuter en embarqué. Validé sur un robot mobile équipé de ROS2, le système combinait reconnaissance automatique de la parole (ASR), un grand modèle de langage (LLM) et un réseau de neurones convolutif (CNN) pour répondre à des questions orales sur les personnes détectées par sa caméra. Par rapport à une exécution entièrement embarquée, ORICF réduit l'utilisation des ressources de calcul côté robot de 83,16% et la consommation énergétique estimée de 65,8%, tout en préservant la modularité et la reproductibilité du pipeline.

Ces résultats adressent l'un des freins les plus concrets au déploiement de modèles fondamentaux sur robots de service ou industriels : la contrainte matérielle embarquée. En déchargeant dynamiquement l'inférence sur des serveurs edge locaux ou des postes de travail voisins, ORICF rend envisageable l'utilisation de modèles lourds (LLM, VLM) sur plateformes à faible puissance de calcul. La spécification déclarative YAML simplifie également les changements de modèles ou de cibles matérielles, avantage concret pour les équipes intégration qui gèrent plusieurs configurations de déploiement. À noter cependant : la validation ne porte que sur un prototype unique en laboratoire, et les métriques de latence de bout en bout en conditions réelles ne sont pas détaillées dans le preprint, ce qui limite l'extrapolation aux environnements industriels.

ORICF s'inscrit dans un mouvement plus large d'outillage de la robotique embarquée avec des modèles fondamentaux, alors que ROS2 s'est imposé comme infrastructure standard pour les robots de recherche et de plus en plus industriels. Plusieurs approches concurrentes ciblent le même problème : Isaac ROS de NVIDIA propose une pile d'inférence optimisée pour hardware Jetson, tandis que des acteurs comme Hailo adressent le déploiement sur puces dédiées. Le preprint ne cite pas d'affiliation universitaire ni d'entreprise sponsor visible, ce qui reste un signal à surveiller pour évaluer la maturité et la continuité du projet. Les prochaines étapes logiques seraient une validation sur des plateformes robotiques hétérogènes et une évaluation de latence en conditions opérationnelles réelles.

Dans nos dossiers

À lire aussi

NVIDIA lance Halos, un système de sécurité complet pour la robotique
1Robotics Business Review 

NVIDIA lance Halos, un système de sécurité complet pour la robotique

NVIDIA a lancé Halos for Robotics, un système de sécurité à pile complète pour la robotique industrielle et l'IA physique. Premier intégrateur officiel : Agility Robotics, dont les humanoïdes opèrent en entrepôts et usines pour Amazon, GXO, Schaeffler et Toyota Motor Manufacturing Canada. L'architecture couvre trois couches : la plateforme de calcul NVIDIA IGX Thor avec le Holoscan Sensor Bridge pour la connectivité capteurs en temps réel ; Halos OS incluant Halos Core ; et le Outside-In Safety Blueprint, un programme open source disponible sur GitHub qui pilote le comportement du robot via des caméras externes et des agents IA. NVIDIA revendique 18 600 années-ingénieur de développement sécurité issus de son activité véhicule autonome. L'écosystème associe des partenaires logiciels (QNX, Amazon FreeRTOS, Acontis), fabricants de systèmes embarqués (Advantech, NexCobot), fournisseurs de semi-conducteurs (Infineon, NXP, SICK, STMicroelectronics, Texas Instruments) et organismes de certification (TÜV Rheinland, TÜV SÜD, UL Solutions, exida, SGS, CertX). Halos Core est déjà certifié ISO 26262 par TÜV SÜD. Le système est disponible en early access pour les développeurs enregistrés, en configurations Linux et Linux+QNX. L'enjeu de Halos est de répondre à un problème structurel : l'absence d'architecture de sécurité standardisée pour des robots autonomes opérant aux côtés de travailleurs. Les intégrateurs composaient jusqu'ici avec des solutions hétérogènes, ce qui complexifiait la certification et freinait le passage à l'échelle. En proposant une pile unifiée du silicium à la supervision logicielle, NVIDIA cherche à s'imposer comme substrat commun de la sécurité robotique industrielle. La certification ISO 26262 de Halos Core est un signal concret : NVIDIA transfère une base éprouvée du monde AV vers la robotique, ce qui pourrait raccourcir les cycles de validation pour les intégrateurs et réduire les coûts de certification tiers. NVIDIA construit depuis plusieurs années une position dans la robotique via les plateformes Isaac, Omniverse et les modèles de fondation GR00T N2. Halos complète cette stratégie d'infrastructure : vendre le substrat computationnel et logiciel, pas les robots eux-mêmes. Les concurrents directs incluent FORT Robotics dans les solutions de sécurité embarquée (qui figure d'ailleurs parmi les partenaires Halos), ainsi que les approches propriétaires de Boston Dynamics ou Fanuc. L'annonce reste un early access sans données publiques de déploiement à grande échelle avec Halos effectivement activé. Les prochaines inspections de certification de l'IGX Thor et du Holoscan Sensor Bridge par TÜV Rheinland constitueront le vrai indicateur de maturité opérationnelle du système.

UESTMicroelectronics (France/Italie) figure parmi les partenaires semi-conducteurs de Halos, et les organismes TÜV Rheinland et TÜV SÜD (Allemagne) sont intégrés au programme de certification, ce qui peut raccourcir les cycles de validation réglementaire pour les intégrateurs robotiques européens.

InfrastructureOpinion
1 source
EtherCAT pour le contrôle des articulations de robots : les explications de GigaDevice
2Pandaily 

EtherCAT pour le contrôle des articulations de robots : les explications de GigaDevice

GigaDevice a organisé un webinaire intitulé "Secure Robotics in Motion" pour exposer la direction prise par les systèmes de contrôle robotique modernes, avec un focus sur EtherCAT, le protocole de communication temps réel déterministe qui s'impose dans la synchronisation des articulations multi-axes. Une main dextre de robot humanoïde intègre typiquement 10 à 20 degrés de liberté (DOF), chacun adossé à un moteur, une suite de capteurs, un algorithme de contrôle et un lien de communication devant délivrer les données à la microseconde près. EtherCAT répond à ce défi via une architecture maître-esclave où chaque nœud traite les données à la volée, atteignant des temps de cycle de 20 à 250 microsecondes avec une gigue inférieure à 1 microseconde. Les horloges distribuées garantissent une référence temporelle commune à tous les axes, évitant les désynchronisations qui rendraient tout mouvement coordonné impossible. Pour adresser ce marché directement, GigaDevice a présenté sa série GD32H75E : un microcontrôleur Cortex-M7 cadencé jusqu'à 600 MHz, avec DSP, FPU double précision et MPU, intégrant un contrôleur esclave EtherCAT plus deux PHYs sur un même die. Le chip embarque également une unité mathématique trigonométrique (TMU), des filtres FIR/IIR, un filtre numérique haute performance (HPDF), une sortie de division de fréquence d'encodeur (EDOUT), et un ensemble de fonctions sécurité : AES, SHA, HMAC, EFUSE, TRNG et démarrage sécurisé. L'intégration du contrôleur EtherCAT directement dans le MCU réduit le nombre de composants externes, simplifie le routage des cartes et abaisse la consommation système, ce qui représente un avantage mesurable pour les intégrateurs qui conçoivent des articulations compactes. Plus structurellement, la présence de fonctions de sécurité matérielles signale un changement dans la perception du marché : les robots ne sont plus des systèmes isolés mais des noeuds réseau exposés dans des usines, entrepôts et environnements domestiques. Le fait qu'un fournisseur de microcontrôleurs grand public comme GigaDevice propose désormais un SoC dédié à ce cas d'usage indique que la demande en volume commence à justifier du silicium spécialisé, au-delà des solutions FPGA ou des stacks logiciels ajoutés sur des MCUs génériques. GigaDevice, fondé en 2005 à Pékin et coté à Shanghai, s'est imposé sur le marché des microcontrôleurs GD32 en concurrence directe avec STMicroelectronics, NXP, Renesas et Texas Instruments. EtherCAT a été développé par Beckhoff Automation dans les années 2000 et reste géré par l'ETG (EtherCAT Technology Group), qui compte aujourd'hui plus de 7 500 membres. Dans l'espace des contrôleurs EtherCAT dédiés, GigaDevice se positionne face à Hilscher, Microchip (LAN9252) et Beckhoff lui-même. Le webinaire ne s'accompagne pas d'annonces de déploiements clients ni de volumes de production, ce qui en fait davantage une communication de positionnement produit qu'un retour terrain. La prochaine étape observable sera la présence de la série GD32H75E dans des kits d'articulations humanoïdes ou des drives de servomoteurs commerciaux.

UELa montée en puissance de GigaDevice sur le segment des MCUs robotiques représente une pression concurrentielle directe sur STMicroelectronics, acteur franco-italien explicitement cité comme concurrent direct dans ce marché des microcontrôleurs industriels.

InfrastructureActu
1 source
RealSense dévoile la caméra de profondeur D585 Pro, conçue nativement pour l'IA et la robotique
3Robotics Business Review 

RealSense dévoile la caméra de profondeur D585 Pro, conçue nativement pour l'IA et la robotique

RealSense a présenté le D585 Pro à l'Automate 2026 (stand 12036), une caméra de profondeur à traitement IA embarqué destinée aux robots humanoïdes, aux AMR (robots mobiles autonomes), aux bras cobots et aux systèmes d'inspection industrielle. La commercialisation est prévue pour le premier trimestre 2027. Le capteur est construit autour d'un SoC propriétaire de cinquième génération intégrant un moteur de profondeur, un processeur ISP, un DSP, des accélérateurs IA dédiés et un ARM quadricœur. Les spécifications annoncées : champ de vision de 120x100°, 60 images par seconde à 1280x960, portée minimale inférieure à 15 cm en pleine résolution, portée maximale supérieure à 10 mètres, indice IP65 en standard sur chaque unité, connectivité GMSL2 et USB-C avec synchronisation matérielle. RealSense revendique une qualité de profondeur deux fois supérieure à sa génération précédente et une réduction du bruit doublée. À la livraison, le traitement de profondeur amélioré et la détection de personnes fonctionneront en bêta directement sur le SoC, sans charge CPU hôte. Des capacités supplémentaires, dont l'odométrie visuo-inertielle (VIO), la génération de grille d'occupation, la calibration automatique et la détection de visages, seront ajoutées via mises à jour SDK après disponibilité générale. Le D585 Pro cible deux limitations structurelles des caméras de profondeur actuelles en robotique : la plage proche et la dépendance au calcul hôte. En descendant à moins de 15 cm en pleine résolution, RealSense revendique un avantage de 2,5x sur le concurrent le plus proche, sans le nommer, ce qui ouvre des cas d'usage jusqu'ici difficiles à couvrir avec un seul capteur : picking en bac, inspection à courte portée, scan de rayonnages denses. Le flux RGB dual synchronisé, deux flux 30 FPS couleur et profondeur fusionnés sur caméra sans overhead CPU, est directement pertinent pour les pipelines VLA dont dépendent des systèmes comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, qui requièrent une perception couleur-profondeur synchronisée. Le modèle logiciel évolutif, où de nouvelles capacités arrivent par SDK sans remplacement matériel, est un changement de paradigme commercial notable dans un secteur où les cycles de qualification hardware sont longs et coûteux pour les intégrateurs. RealSense est une marque historiquement liée à Intel, qui avait progressivement retiré ses investissements dans la perception 3D avant de céder l'activité. La société s'est repositionnée sous direction indépendante, avec Nadav Orbach comme CEO. Elle évolue dans un marché sous forte pression concurrentielle : Luxonis (OAK-D), Orbbec, Stereolabs (ZED X), et des acteurs industriels comme Photoneo ou SICK occupent des segments adjacents. La promesse d'un capteur unique couvrant 15 cm à 10 m, utilisable en intérieur comme en extérieur à 60 FPS avec IA embarquée, est techniquement ambitieuse. Aucun partenaire de déploiement n'a été nommé publiquement à ce stade, et les performances annoncées reposent sur des données fabricant non validées par des tiers indépendants. La livraison effective au premier trimestre 2027 constituera le vrai test de maturité de la plateforme.

InfrastructureOpinion
1 source
L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL
4Robotics Business Review 

L'évolution de la connectivité visuelle en robotique : de l'USB et l'Ethernet au GMSL

La connectivité vision dans les systèmes robotiques traverse une mutation structurelle. Pendant près d'une décennie, les intégrateurs ont déployé des caméras USB ou Ethernet (protocole GigE Vision) pour alimenter les pipelines de perception des robots. L'USB, bon marché et universellement supporté, suffisait au prototypage, mais ses contraintes de longueur de câble, sa latence non déterministe et sa charge CPU élevée l'ont rendu inadapté aux plateformes complexes. GigE Vision a ensuite étendu la portée et standardisé les interfaces entre fournisseurs, au prix d'un processeur embarqué sur chaque caméra pour packetiser les données, ajoutant latence et complexité réseau. Aujourd'hui, le GMSL (Gigabit Multimedia Serial Link), conçu initialement pour les systèmes caméra de l'automobile, s'impose comme alternative de référence dans les architectures robotiques de nouvelle génération. Ce standard transmet des images non compressées, un contrôle bidirectionnel et l'alimentation électrique sur un unique câble coaxial ou paire torsadée blindée, sur plusieurs mètres de portée, adapté aux plateformes mobiles et articulées. La tendance est claire : les robots modernes embarquent désormais huit capteurs d'images ou plus, répartis sur l'ensemble de la structure, pour des fonctions allant de l'évitement d'obstacles à la manipulation dextre et à l'interaction humain-robot. L'enjeu pour les intégrateurs et décideurs B2B est celui du déterminisme. Les systèmes USB et Ethernet souffrent d'arbitrage et de buffering qui introduisent une variabilité de latence incompatible avec la perception temps réel : boucles de contrôle pour la manipulation, fusion LiDAR-IMU-caméra, vision stéréo synchronisée. GMSL établit une liaison point-à-point dédiée par caméra vers un calculateur centralisé (GPU embarqué ou FPGA), éliminant ces aléas. C'est un changement d'architecture, pas simplement d'interface : le traitement migre vers un noeud central unique plutôt que d'être fragmenté sur chaque caméra. Pour les plateformes qui doivent fusionner données RGB, LiDAR, radar et IMU avec une synchronisation stricte - typiquement les humanoïdes et les AMR de nouvelle génération - ce déterminisme est une exigence fonctionnelle, pas un confort. Le GMSL est issu de l'industrie automobile, où Analog Devices (ADI), principal promoteur de la technologie, l'a développé pour répondre aux exigences des systèmes ADAS et de conduite autonome : robustesse électromagnétique, temps réel, longues portées de câble. Ce transfert technologique auto-vers-robotique s'inscrit dans une dynamique plus large du secteur, où plusieurs standards automotive (Ethernet TSN, MIPI CSI-2) trouvent des débouchés dans les plateformes robotiques. ADI n'est pas seul sur ce créneau : Texas Instruments et NVIDIA proposent leurs propres écosystèmes de connectivité vision pour la robotique, et le choix d'interface reste un facteur de différenciation dans les appels d'offres industriels. À noter que l'article source est publié par ADI lui-même, ce qui invite à lire les métriques comparatives avec le recul habituel vis-à-vis des communications techniques de fournisseurs. La prochaine étape du secteur sera probablement la standardisation : des consortiums comme MIPI Alliance travaillent à harmoniser les interfaces caméra pour faciliter l'interopérabilité entre fournisseurs de capteurs, de calculateurs et intégrateurs robot.

UELes intégrateurs robotiques européens peuvent être amenés à intégrer le GMSL dans leurs cahiers des charges pour les nouvelles plateformes, mais aucun acteur ou réglementation FR/EU n'est directement impliqué.

InfrastructureActu
1 source