Aller au contenu principal

Dossier AMR & automatisation d'entrepôt

35 articles

AMR et automatisation d'entrepôt : Amazon Robotics, Symbotic, Locus, GreyOrange, Geek+, déploiements e-commerce et logistique tiers.

Perception sémantique active
1arXiv cs.RO RecherchePaper

Perception sémantique active

Des chercheurs ont publié sur arXiv (2510.05430v2) une méthode de perception sémantique active permettant à un robot mobile d'explorer un environnement intérieur en raisonnant sur les zones qu'il n'a pas encore observées. Le système construit un graphe de scène multi-couches et compact, structurant l'environnement à plusieurs niveaux d'abstraction : pièces, objets, murs, fenêtres, avec leur géométrie fine. En s'appuyant sur un grand modèle de langage (LLM), le pipeline génère des graphes de scène plausibles pour les régions inexplorées, en maintenant la cohérence avec les observations partielles déjà accumulées. L'approche calcule ensuite le gain d'information attendu à chaque point de passage candidat, afin de guider la trajectoire d'exploration. Les expériences ont été menées à la fois en simulation sur des appartements 3D réalistes et sur un robot quadrupède Unitree Go 2 en conditions réelles. L'intérêt principal de cette approche réside dans la capacité à exploiter des connaissances sémantiques commonsense pour anticiper la topologie d'une scène non encore visitée. Plutôt que de se limiter à une cartographie géométrique réactive, le robot raisonne sur la probabilité qu'une porte donne sur une cuisine plutôt qu'une chambre selon le contexte observé, un type de raisonnement spatial jusqu'ici difficile à formaliser en robotique mobile. Pour les intégrateurs d'AMR (autonomous mobile robots) et les équipes R&D en navigation intérieure, cette architecture ouvre la voie à des explorations plus efficaces dans des environnements inconnus, avec moins de déplacements redondants. Les résultats quantitatifs montrent une localisation plus rapide et plus précise des informations sémantiques hautes et basses résolutions par rapport aux méthodes existantes, bien que les benchmarks retenus méritent une lecture critique puisqu'ils restent essentiellement contrôlés par les auteurs. Ce travail s'inscrit dans un courant actif combinant graphes de scène hiérarchiques et LLMs pour la navigation sémantique, aux côtés de travaux comme SayPlan (Rana et al.) ou SceneGraph-Nav. Le Unitree Go 2, robot quadrupède à faible coût devenu plateforme standard pour la recherche en mobilité intérieure, sert ici de démonstrateur physique. Les acteurs concurrents incluent les approches par représentations neurales implicites (NeRF sémantiques) et les méthodes de frontier-based exploration enrichies par vision-langage. Le code n'est pas encore publié à la date de soumission, et aucun partenariat industriel ni calendrier de transfert n'est mentionné dans le papier.

1 source
Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots
2arXiv cs.RO 

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots

Une équipe de chercheurs a publié le 11 juin 2026 sur arXiv (2606.12070) un framework mathématique baptisé "fibration trees" visant à unifier les méthodes de planification de mouvement pour des équipes de robots multiples. Le système repose sur une structure en arbre où chaque noeud représente un espace d'états et chaque arête une fibration, c'est-à-dire une projection d'un espace de haute dimension vers un espace simplifié de dimension inférieure. Sur cette base formelle, les chercheurs ont développé un planificateur d'échantillonnage appelé Fibration-RRT (Rapidly-Exploring Random Fibration Trees), validé sur 32 scénarios impliquant des équipes de robots atteignant jusqu'à 96 degrés de liberté (DOF). L'implémentation est publiée en open source, et le planificateur est prouvé probabilistiquement complet. L'enjeu est la fameuse "malédiction de la dimensionnalité" : dès que l'on coordonne plusieurs robots, l'espace de configuration combiné explose exponentiellement, rendant la planification classique intractable. Les approches existantes répondaient à ce problème soit par la priorisation séquentielle (planifier les robots un par un), soit par la décomposition parallèle (sous-espaces indépendants), soit par des projections dans l'espace des tâches, mais sans framework commun capable de combiner ces stratégies. Fibration-RRT généralise à la fois le quotient-space RRT et le discrete RRT sous un formalisme unique, ce qui permet en théorie à un intégrateur de définir sa propre structure d'arbre selon la topologie du problème plutôt que de choisir entre des outils incompatibles. La robustesse sur 96 DOF est un signal technique solide, même si l'article ne fournit pas de comparaison de temps de cycle sur des benchmarks standardisés industrie. La planification de mouvement multi-robot est un domaine mature sur le plan académique, porté depuis la fin des années 1990 par les algorithmes RRT de Steven LaValle et leurs variantes (RRT*, BiRRT, quotient-space RRT de Orthey et al.). Le besoin d'unification se fait sentir à mesure que les déploiements AMR (autonomous mobile robots) et les cellules robotisées industrielles complexifient les interdépendances entre agents. Aucun acteur industriel n'est mentionné dans ce préprint, qui reste pour l'instant une contribution théorique. Les prochaines étapes naturelles seraient une validation sur des plateformes physiques et une intégration dans des middlewares standards comme ROS 2 MoveIt, qui constitue aujourd'hui la référence dans les projets d'intégration multi-bras.

RecherchePaper
1 source
Robot à 20 yeux et 20 pattes capable de se déplacer dans toutes les directions avec la même aisance
3New Atlas Robotics 

Robot à 20 yeux et 20 pattes capable de se déplacer dans toutes les directions avec la même aisance

Des chercheurs de l'université Duke ont présenté Argus, un robot à vingt pattes et vingt capteurs visuels inspiré de l'oursin, conçu pour se déplacer avec une efficacité égale dans toutes les directions. Contrairement aux plateformes mobiles conventionnelles à symétrie bilatérale, Argus adopte une architecture radialement symétrique, avec ses membres et ses capteurs distribués uniformément autour d'un corps central. Cette géométrie lui permet de se déplacer latéralement, en diagonale ou en rotation sans reconfigurer sa posture, éliminant les angles morts de déplacement propres aux robots à symétrie gauche-droite. L'implication principale pour la robotique mobile est de remettre en question un postulat de conception quasi universel : la symétrie bilatérale, héritée de l'anatomie vertébrée, n'est pas nécessairement optimale pour un robot opérant dans des environnements encombrés ou nécessitant une réactivité omnidirectionnelle rapide. Pour les intégrateurs et concepteurs de systèmes AMR (autonomous mobile robots), Argus ouvre la voie à des architectures non-anthropomorphes mieux adaptées à des tâches d'exploration, d'inspection en espace confiné, ou de manipulation en milieu chaotique. Le concept prouve expérimentalement que la locomotion à pattes multiples distribuées peut résoudre le problème de la mobilité isotrope sans recourir à des roues omnidirectionnelles. L'oursin de mer, organisme à symétrie pentaradiée, constitue depuis plusieurs années une source d'inspiration pour la robotique de locomotion non conventionnelle, aux côtés des travaux sur les échinodermes menés notamment au MIT et chez Festo. Argus pousse cette logique à vingt membres, ce qui augmente la redondance actionnée et la tolérance aux défaillances. Les prochaines étapes probables incluent des tests en environnement réel et une réduction d'échelle pour des applications d'inspection en pipeline ou en structure, segments où les robots à symétrie bilatérale peinent à manœuvrer.

RecherchePaper
1 source
Les robots du futur pourraient éviter les dommages en se roulant en boule comme des tatous
4New Atlas Robotics 

Les robots du futur pourraient éviter les dommages en se roulant en boule comme des tatous

Des chercheurs du département de génie mécanique et aérospatial de la North Carolina State University ont publié des travaux sur une structure de protection robotique inspirée de l'armadille, le mammifère connu pour sa capacité à se rouler en boule face aux prédateurs. Le concept consiste à équiper des robots d'un exosquelette articulé capable de se replier sur lui-même de manière autonome lorsque le système détecte un risque de choc ou de chute, absorbant l'énergie d'impact et protégeant les composants internes. L'article, classé en robotique et ingénierie sous les thèmes biomimétisme et armure, ne fournit pas de métriques précises sur le prototype (masse, matériaux, temps de réponse), ce qui limite l'évaluation indépendante des performances annoncées. L'enjeu industriel est réel : la fragilité mécanique reste l'un des principaux freins au déploiement de robots mobiles dans des environnements non structurés, entrepôts, chantiers, ou domiciles. Une solution de protection passive qui ne dépend pas de l'électronique embarquée constituerait un avantage significatif en termes de fiabilité et de coût de maintenance. Si le mécanisme se révèle fonctionnel à l'échelle, il pourrait intéresser les fabricants d'AMR (autonomous mobile robots) et les concepteurs d'humanoïdes exposés à des chutes fréquentes lors des phases de déploiement. La biomimétique appliquée à la robotique connaît un regain d'intérêt depuis cinq ans, portée par des travaux sur les exosquelettes inspirés des insectes, la locomotion des serpents, ou les pattes des chats. NC State s'inscrit dans cette tendance avec plusieurs projets en parallèle. Les concurrents directs sur la protection passive incluent des approches par matériaux à rigidité variable (soft robotics) ou par coques modulaires démontables. Aucune date de prototype opérationnel ni partenariat industriel n'est mentionné dans l'extrait disponible.

RecherchePaper
1 source
Les robots explorent des environnements inconnus grâce à un lidar avancé
5Interesting Engineering 

Les robots explorent des environnements inconnus grâce à un lidar avancé

Ouster, spécialiste du lidar basé à San Francisco, et FieldAI, développeur d'IA robotique californien, ont annoncé un partenariat centré sur l'intégration du capteur lidar numérique Rev8 d'Ouster avec la plateforme Field Foundation Models de FieldAI. L'objectif : permettre à des robots généralistes de se déployer sur de nouveaux sites industriels sans cartographie préalable, sans infrastructure dédiée et sans modification de l'environnement. La plateforme FieldAI est conçue comme un "cerveau" universel capable d'opérer sur des types de robots très différents, dans des conditions changeantes : chantiers de construction, mines, sites énergétiques, installations souterraines et zones industrielles sans couverture GPS. Le Rev8 apporte une couche de perception couleur native aux données lidar classiques, combinant ainsi la précision de la mesure de distance par impulsions laser avec une interprétation chromatique de l'environnement. Aucun chiffre de déploiement, de prix ou de volume client n'a été communiqué dans l'annonce, il s'agit à ce stade d'une collaboration technologique déclarée, pas d'un produit expédié. Ce partenariat pointe vers un verrou structurel du secteur : la dépendance des robots industriels aux environnements précartographiés. Les systèmes AMR (autonomous mobile robots) conventionnels exigent typiquement des semaines de mapping, des marquages au sol ou des balises fixes avant de pouvoir opérer. La proposition de FieldAI, entrer sur un site comme un nouvel employé, évaluer l'environnement et commencer à travailler sans connaissance préalable, représente un changement de paradigme si elle se confirme à l'échelle. L'ajout du lidar couleur Rev8 renforce l'interprétabilité des décisions du robot (distinguer un obstacle fixe d'un opérateur en mouvement, identifier des équipements par leur apparence) et améliore la sécurité dans des contextes où caméras seules ou GPS sont insuffisants. Pour un intégrateur ou un COO industriel, cela se traduit potentiellement par une réduction significative des coûts et délais de mise en service, le principal frein commercial des déploiements robotiques en environnements non structurés. FieldAI s'est construit sur la conviction que les grands modèles de fondation, entraînés à comprendre le monde physique plutôt qu'une tâche spécifique, constituent la brique manquante pour généraliser l'autonomie robotique. Ouster, de son côté, est issu de la vague lidar initiée par Velodyne et ses concurrents ; son passage au lidar numérique (SPAD-based) lui a permis de réduire les coûts et d'augmenter la résolution. Sur le marché des capteurs de perception pour robots industriels, Ouster concurrence Hesai (Chine), Innoviz (Israël) et Luminar (États-Unis), tandis que FieldAI se positionne face à des plateformes d'intelligence robotique comme Boston Dynamics AI Institute, Intrinsic (Google) ou ANYbotics. Aucun acteur européen n'est impliqué dans ce partenariat. Les prochaines étapes annoncées incluent l'intégration du Rev8 dans les déploiements en cours de FieldAI chez ses clients industriels, sans calendrier précis communiqué.

IndustrielOpinion
1 source
Pourquoi les systèmes temps réel déterministes sont plus essentiels que jamais en robotique
6Robotics Business Review 

Pourquoi les systèmes temps réel déterministes sont plus essentiels que jamais en robotique

Dans l'épisode 245 du Robot Report Podcast, Winston Leung, directeur des alliances stratégiques chez BlackBerry QNX, développe un argument central : à mesure que les robots autonomes intègrent les environnements humains, les systèmes d'exploitation temps réel déterministes deviennent un prérequis de sécurité fonctionnelle, pas un simple choix d'infrastructure. QNX, filiale de BlackBerry, mise sur une architecture microkernel propriétaire qui isole les processus critiques et garantit des temps de réponse bornés, quelle que soit la charge CPU. L'entreprise a présenté à l'occasion du Robotics Summit & Expo 2025 son "Inside the Robot: Architecture Benchmark Report", une étude comparative des architectures logicielles embarquées dans les robots actuels. En parallèle, deux actualités ont retenu l'attention cette semaine : Slamcore a levé 14 millions de dollars pour sécuriser l'automatisation d'entrepôts, et Amazon a étendu les capacités de son robot Proteus en Europe, lui ajoutant une interface en langage naturel. La montée en puissance des robots humanoïdes et des AMR (autonomous mobile robots) en milieu industriel pose une exigence que ROS 2, conçu pour la recherche, ne couvre pas nativement : la prévisibilité absolue des temps de cycle et la résistance aux attaques cybernétiques sur des systèmes embarqués exposés en réseau. Un microkernel comme celui de QNX permet d'isoler les défaillances logicielles dans des espaces mémoire séparés, réduisant la surface d'attaque et empêchant qu'un crash applicatif compromette le contrôle moteur ou les fonctions de sécurité. Les partenariats annoncés avec NVIDIA et Intel visent à optimiser cet OS pour les SoC haute performance (Jetson, Core Ultra) qui équipent la prochaine génération de robots, combinant inférence d'IA embarquée et contraintes temps réel strictes. Pour un intégrateur ou un COO industriel, le message est direct : déployer un robot dans un espace partagé avec des humains sans couche RTOS certifiable représente un risque de conformité croissant, notamment en Europe avec la révision de la directive machines. QNX est présent depuis les années 1980 dans les systèmes embarqués critiques, d'abord dans l'industrie médicale et l'aérospatiale, puis massivement dans l'automobile avec des déploiements chez BMW, Ford ou Honda. Son rachat par BlackBerry en 2010 lui a apporté une orientation cybersécurité que ses concurrents directs, Wind River VxWorks et LynuxWorks, n'ont pas développée au même niveau. Face à l'essor de ROS 2 dans la robotique commerciale, QNX se positionne non pas comme un remplacement mais comme une couche de sécurité complémentaire, un argument que son benchmark report cherche visiblement à étayer avec des données comparatives. Les prochaines étapes pour l'entreprise passent par l'élargissement de ces partenariats matériels et par la certification de son stack pour les normes robotiques émergentes, notamment ISO 10218 et ISO/TS 15066 pour la collaboration humain-robot.

UELa révision de la directive machines européenne impose un risque de conformité croissant pour les intégrateurs EU déployant des robots en espaces partagés sans RTOS certifiable ; l'extension d'Amazon Proteus en Europe renforce l'urgence de ces exigences pour les opérateurs logistiques.

InfrastructureOpinion
1 source
Chine : Pudu dévoile un robot semi-humanoïde apprenant pour transformer l'automatisation industrielle
7Interesting Engineering 

Chine : Pudu dévoile un robot semi-humanoïde apprenant pour transformer l'automatisation industrielle

Pudu Robotics, entreprise fondée à Shenzhen spécialisée jusqu'ici dans les robots de service (livraison en restaurant, nettoyage), a présenté une version actualisée de son D7, robot semi-humanoïde industriel initialement dévoilé en 2024. La plateforme associe un châssis omnidirectionnel, deux bras manipulateurs et un torse anthropomorphe, le tout piloté par PuduFM 1.0, un modèle de fondation propriétaire entraîné sur des données opérationnelles réelles. Le D7 prend en charge des charges utiles jusqu'à 14 kg et peut atteindre des hauteurs de 2 mètres, ce qui lui permet d'interagir avec des systèmes de stockage en hauteur. Il est équipé de capteurs tactiles offrant une précision de contrôle de force au millimètre, d'un double LiDAR avant-arrière pour la navigation en environnement dynamique, et d'un système de remplacement autonome des batteries permettant une opération 24 h/24 sans intervention humaine. Les applications visées incluent la manutention, le picking en étagères, le réapprovisionnement de stocks et le transport interne en entrepôt ou en usine. Ce qui distingue la proposition de Pudu des AMR (autonomous mobile robots) classiques, c'est l'ambition d'un apprentissage continu en production : l'architecture collecte des données opérationnelles en boucle fermée, les transmet à faible latence et réentraîne le modèle sur les tâches réellement effectuées. Si ce mécanisme fonctionne à l'échelle, cela représente un changement notable pour les intégrateurs industriels qui gèrent aujourd'hui des flottes de robots aux capacités figées après déploiement. La plateforme PuduAgent, annoncée comme prochaine étape, viserait la coordination multi-robots sur des flux de travail complexes. Il convient toutefois de nuancer : la présentation repose sur des affirmations du fabricant, sans données tierces sur les taux d'apprentissage effectifs ni sur la performance en conditions de production réelle. La distinction entre ce qui est opérationnel aujourd'hui et ce qui reste en développement n'est pas clairement établie dans les communications officielles. Pudu s'est construit une base industrielle avec ses robots de livraison déployés dans des milliers de restaurants en Chine et à l'international, ce qui lui confère une expérience opérationnelle terrain que n'ont pas tous ses concurrents dans le segment humanoïde. Sur ce marché, le D7 se positionne face à des acteurs comme Agility Robotics (Digit, déployé chez Amazon), Figure (Figure 02), 1X Technologies ou Fourier Intelligence, tous engagés dans la même course au robot humanoïde pour la logistique. Côté modèles de fondation pour la manipulation (VLA), la concurrence inclut Physical Intelligence (pi0), Boston Dynamics et les équipes de recherche de DeepMind. Aucun déploiement client ni pilote industriel n'a été annoncé à ce stade pour la version actualisée du D7, ce qui place cette présentation davantage dans la catégorie annonce produit que déploiement réel.

Chine/AsieOpinion
1 source
ShelfAware : localisation sémantique en temps réel dans des environnements quasi-statiques avec des capteurs bas coût
8arXiv cs.RO 

ShelfAware : localisation sémantique en temps réel dans des environnements quasi-statiques avec des capteurs bas coût

Des chercheurs ont publié sur arXiv (2512.09065v2) ShelfAware, un filtre particulaire sémantique conçu pour la localisation globale de robots mobiles dans des environnements dits quasi-statiques : des espaces dont la géométrie générale est stable mais dont les contenus changent continuellement, comme les rayons d'un supermarché ou les allées d'un entrepôt logistique. Le système fusionne une vraisemblance de profondeur avec une similarité sémantique centrée sur les catégories d'objets, et génère des hypothèses de pose via des propositions inverses précalculées intégrées dans un cadre Monte Carlo Localization (MCL). Évalué dans un environnement de vente fictif rigoureusement contrôlé, ShelfAware atteint un taux de succès de localisation globale de 97 % et maintient un taux de suivi de 66 % dans des conditions d'occultation variées (chariot, dispositif portable, obstruction dynamique). Dans un second test mené dans un supermarché opérationnel de 325 m², le système s'appuie sur un pipeline de vision à vocabulaire ouvert et surpasse significativement les approches géométriques seules ainsi que les méthodes sémantiques à points de repère fixes. L'ensemble tourne sur du matériel vision bas coût, sans capteur LiDAR. Ce qui est notable ici, c'est moins la performance brute que l'approche architecturale. La grande majorité des systèmes de localisation sémantique traitent les objets comme des landmarks discrets et fixes : un objet identifié = une position dans la carte. ShelfAware modélise à la place la sémantique de manière distributionnelle, comme une évidence statistique sur des catégories, ce qui le rend résilient aux changements de stock, aux réorganisations et au désordre dynamique. Pour un intégrateur déployant des AMR (autonomous mobile robots) en grande distribution ou en logistique de dernier kilomètre, cela signifie une localisation sans infrastructure additionnelle (pas de QR codes, pas de balises UWB), avec un hardware limité au seul RGB-D ou monoculaire. L'article s'inscrit dans un effort de recherche plus large visant à combler le fossé entre les environnements de laboratoire et les déploiements réels dans des espaces peuplés et changeants. Les approches concurrentes incluent les méthodes SLAM visuelles (ORB-SLAM3, OpenVINS) et les systèmes sémantiques basés sur des réseaux de neurones comme Nice-SLAM ou Semantic-NeRF, qui offrent de meilleures représentations mais exigent des ressources computationnelles bien supérieures. ShelfAware opte pour un compromis pragmatique : représentation légère, généralisation par le vocabulaire ouvert (CLIP ou équivalent), et intégration native dans MCL. Il s'agit d'une contribution académique préprint, pas d'un produit commercialisé : aucun déploiement industriel ni partenariat industriel n'est annoncé à ce stade. Des acteurs comme Simbe Robotics ou Badger Technologies, positionnés sur la robotique de retail avec infrastructure propriétaire, constituent le référentiel concurrentiel naturel face auquel une telle approche sans infrastructure prendrait de la valeur.

RecherchePaper
1 source
Collaboration humain-robot : concevoir les espaces de travail modernes pour la sécurité, la productivité et le bien-être des employés
9Robotics & Automation News 

Collaboration humain-robot : concevoir les espaces de travail modernes pour la sécurité, la productivité et le bien-être des employés

Le marché mondial de la robotique industrielle, évalué à 85 milliards de dollars, connaît une transformation structurelle : les barrières physiques qui séparaient opérateurs et machines disparaissent progressivement des lignes de production, remplacées par des zones de collaboration directe. Des millions de robots industriels sont aujourd'hui déployés dans des environnements partagés, où la cohabitation homme-machine impose une refonte complète de la conception des postes de travail, en s'appuyant sur la géométrie spatiale, les standards de sécurité fonctionnelle (ISO 10218, ISO/TS 15066) et la psychologie des opérateurs. Cet enjeu dépasse la simple conformité réglementaire. Pour les intégrateurs et les COO industriels, la suppression des cages protectrices au profit de robots collaboratifs (cobots) ou de cellules HRC (Human-Robot Collaboration) implique une réévaluation complète des flux, des distances de sécurité, et de l'ergonomie cognitive. Des études montrent que l'acceptation des opérateurs est directement liée à la prévisibilité des mouvements des robots et à leur formation initiale, deux leviers souvent sous-estimés dans les projets de déploiement industriel. La tendance s'est accélérée depuis l'émergence des cobots d'Universal Robots, Fanuc et KUKA au début des années 2010, mais aussi avec la montée des AMR (Autonomous Mobile Robots) d'acteurs comme Exotec, basé à Croix (France), qui déploie ses systèmes dans des entrepôts logistiques à forte densité humaine. Les prochaines étapes du secteur portent sur l'intégration de capteurs de perception avancés et d'IA embarquée pour adapter dynamiquement le comportement des robots à la présence humaine en temps réel.

UEExotec, entreprise française basée à Croix, est citée en exemple de déploiement AMR à forte densité humaine, confirmant la maturité des acteurs européens sur la collaboration homme-robot en environnement logistique réel.

IndustrielOpinion
1 source
Les interactions structurées améliorent la coordination distribuée mieux que le passage à l'échelle des modèles dans un système multi-robots réel
10arXiv cs.RO 

Les interactions structurées améliorent la coordination distribuée mieux que le passage à l'échelle des modèles dans un système multi-robots réel

Une étude déposée sur arXiv (ref. 2605.30383) compare, dans un système multi-robots réel, deux leviers d'amélioration des performances collectives : restructurer la topologie de communication entre robots, ou augmenter la taille des modèles d'apprentissage embarqués. Le protocole mobilise 10 robots physiques sur une tâche combinée de transport et de cartographie, soit 60 runs au total (5 par condition expérimentale). Résultat principal : passer d'une architecture entièrement connectée à une hiérarchie modulaire améliore la performance normalisée de 47 points sur une échelle 0 à 100, contre au maximum 9 points gagnés en doublant la taille des couches cachées du réseau de neurones. Des modèles mixtes à effets imbriqués confirment que la topologie de communication explique une variance bien plus importante que la taille du modèle. Une saturation des gains est observée au-delà de 1 024 unités cachées, mais uniquement en extrapolation calibrée par simulation, et non directement sur le matériel testé - une nuance importante pour interpréter ce chiffre. Pour les intégrateurs de flottes robotiques, le message est immédiatement opérationnel : revoir l'architecture de coordination peut offrir un gain de performance cinq fois supérieur à l'ajout de puissance de calcul embarquée par robot, à budget matériel constant. Dans un contexte où les flottes d'AMR (autonomous mobile robots) se densifient dans la logistique et l'industrie manufacturière, l'arbitrage entre intelligence individuelle et structure collective du système devient un choix de conception concret. L'étude questionne une hypothèse largement répandue dans le secteur : que scaler les capacités unitaires de chaque robot est le levier dominant du progrès en robotique collaborative - un biais coûteux si les gains réels se trouvent ailleurs. Cette publication s'inscrit dans le champ du MARL (multi-agent reinforcement learning) déployé sur plateforme physique, un gap encore peu comblé entre benchmark simulé et terrain. Les résultats sont répliqués sur le benchmark SMAC, complétés par des analyses de benchmarks hétérogènes que les auteurs qualifient eux-mêmes de preuves secondaires. Le périmètre reste étroit : une seule tâche, 10 robots, une architecture. La généralisation quantitative à d'autres systèmes et d'autres échelles reste à établir. Les acteurs qui déploient des flottes denses, Exotec en France, Locus Robotics ou 6 River Systems aux États-Unis, opèrent précisément dans ce domaine où l'arbitrage topologie-modèle pourrait peser sur les prochaines roadmaps produit.

UEExotec (France), acteur majeur des flottes AMR logistiques, est explicitement cité comme potentiellement concerné par ces résultats, qui pourraient réorienter les choix d'architecture de coordination dans ses prochaines roadmaps produit.

RecherchePaper
1 source
Voir vite et lentement : graphes de scènes 3D bimodaux pour tâches en domaine ouvert
11arXiv cs.RO 

Voir vite et lentement : graphes de scènes 3D bimodaux pour tâches en domaine ouvert

Des chercheurs ont publié en mai 2026 sur arXiv (identifiant 2605.31067) BiMoSG, un système de génération de graphes de scène 3D bimodal conçu pour l'exécution de tâches à vocabulaire ouvert en robotique autonome. Le principe repose sur deux modes distincts : un mode "rapide" actif par défaut, qui construit une représentation grossière de l'environnement, et un mode "lent" déclenché automatiquement lorsque le robot identifie des zones susceptibles de contenir des objets pertinents pour la tâche en cours. Ce second mode génère un graphe de scène 3D à granularité fine, compatible avec des requêtes sémantiques en langage naturel (open-vocabulary), sans liste d'objets prédéfinie. Les auteurs affirment surpasser en vitesse les approches open-source de référence, sans toutefois publier de métriques chiffrées précises dans l'abstract disponible, un point à vérifier dans le corpus complet avant d'en tirer des conclusions fermes. Ce système s'attaque à une tension structurelle bien connue en robotique de terrain : les représentations haute fidélité sont computationnellement coûteuses et inutiles dans les zones sans intérêt, tandis que les représentations grossières sont insuffisantes au moment de localiser un objet cible. BiMoSG tente de résoudre ce compromis de façon dynamique et contextuelle, ce qui est directement pertinent pour les intégrateurs d'AMR (autonomous mobile robots) en entrepôt ou en logistique industrielle, où le temps de cycle de la couche de perception est un goulot d'étranglement réel. La capacité annoncée à coupler la génération du graphe de scène avec l'exécution de tâches en temps réel, si elle se confirme en déploiement physique, représenterait un pas concret vers des systèmes open-set opérationnels au-delà des démonstrations en environnement contrôlé. Les graphes de scène 3D constituent un champ de recherche actif depuis les travaux fondateurs comme Kimera (MIT, 2020) et les approches plus récentes exploitant des encodeurs visuels de type CLIP pour le matching sémantique, tels que ConceptGraphs ou OpenGraph. BiMoSG s'inscrit dans cette lignée en proposant une stratégie d'allocation de ressources perceptives inspirée du cadre dual-process (cognition rapide versus lente), appliqué ici à la perception robotique. Il s'agit d'une contribution académique sous forme de preprint : aucun partenariat industriel, aucun calendrier de déploiement ni benchmark sur jeux de données standardisés (ScanNet, Replica) ne sont mentionnés dans la version initiale. Les étapes naturelles attendues sont une évaluation quantitative comparative et des tests sur plateformes physiques réelles.

RecherchePaper
1 source
Votre guide pour le dernier jour du Robotics Summit & Expo 2026
12The Robot Report 

Votre guide pour le dernier jour du Robotics Summit & Expo 2026

La deuxième et dernière journée du Robotics Summit & Expo 2026 s'est tenue le 28 mai à Boston, au Thomas M. Menino Convention & Exhibition Center. La matinée a débuté à 8h00 par un petit-déjeuner "Women in Robotics" affiché complet, réunissant Joyce Sidopoulos, cofondatrice et COO de MassRobotics, et Mikell Taylor, directrice de la stratégie robotique chez General Motors. Brian Gerkey, président du conseil d'Open Robotics et CTO d'Intrinsic, a ouvert les keynotes à 9h05 avec "An Open Foundation for the Age of AI-Powered Robots", suivi à 10h00 par Taylor sur "What Makes a Robot Worthy?". Le hall d'exposition a fermé à 15h00, et Noland Arbaugh, premier utilisateur d'une interface cerveau-ordinateur Neuralink, a assuré la keynote de clôture à 15h30. Les sessions de breakout de la journée ont couvert l'intégration d'AMR (autonomous mobile robots) en entrepôt (Greg Meyne, enVista), le déploiement AMR de Tesla dans les usines américaines existantes (Joshua Joseph), la productisation de l'IA robotique dans un panel réunissant Anders Beck d'Universal Robots, Dave Coleman de PickNik Robotics et Andy Lonsberry de Path Robotics, les capteurs force-couple en production (Ryan Young, HBK), et la latence en chirurgie à distance (Darren Porras, Healthcare Real-Time Innovations). Le programme de cette journée de clôture traduit un pivot du secteur vers le déploiement concret plutôt que la démonstration conceptuelle. La session Tesla sur les usines "legacy" est particulièrement significative : Joshua Joseph y présente un retour terrain sur l'intégration d'AMR dans des infrastructures industrielles préexistantes, avec leurs contraintes réelles d'interopérabilité et de connectivité, un sujet que les conférences robotiques évitent souvent au profit des environnements greenfield. La tension entre promesse des modèles VLA (vision-language-action) et fiabilité en production ressort du panel sur la productisation de l'IA, tandis qu'Ariana Eisenstein, fondatrice et CTO de Pickle Robot, apporte un angle pragmatique avec son retour d'expérience sur la transition lab-to-field, étape critique souvent sous-documentée dans les publications académiques et industrielles. Le Robotics Summit & Expo, organisé par The Robot Report, est le principal rendez-vous américain des développeurs de robotique commerciale. MassRobotics, le hub robotique de Boston, en est le partenaire institutionnel central, avec un career fair, un healthcare startup showcase en cinquième édition, et le programme Women in Robotics. L'édition 2026 confirme plusieurs dynamiques de fond : la convergence autour des middlewares ouverts portés par Intrinsic et Open Robotics, la montée en puissance des AMR en logistique, et l'irruption des interfaces cerveau-machine comme vecteur d'attention au-delà du public industriel. Aucun acteur français ou européen ne figure dans le programme publié, confirmant que l'événement reste très ancré dans l'écosystème nord-américain, avec une présence marquée des grands industriels (GM, Tesla, Texas Instruments) aux côtés des pure players robotique comme Universal Robots ou Path Robotics.

IndustrielActu
1 source
Accélérer la planification de trajectoires robotiques grâce à un réseau de propositions de régions préservant la connectivité
13arXiv cs.RO 

Accélérer la planification de trajectoires robotiques grâce à un réseau de propositions de régions préservant la connectivité

Une équipe de chercheurs publie sur arXiv (preprint 2605.28362, mai 2026) le CP-RPN, ou Connectivity-Preserving Region Proposal Network, une architecture de planification de chemin pour robots mobiles conçue pour comprimer drastiquement l'espace de recherche tout en garantissant la cohérence topologique du résultat. Le système repose sur un modèle de segmentation combinant un Deformable Attention Transformer (DAT), qui capture les dépendances longue portée pour assurer la connectivité globale, et un décodeur déconvolutif pour préserver les détails spatiaux fins. La fonction de perte est composite : cross-entropy pixel à pixel, une perte de cohérence locale (Connectivity-Aware loss), et une perte de continuité topologique basée sur l'homologie persistante pour imposer la connectivité globale du masque prédit. Sur ces régions corridor à haute connectivité, le diagramme de Voronoï trace le chemin, avec un mécanisme de repli A* local pour garantir la robustesse. Les résultats expérimentaux annoncés : réduction de la taille des régions candidates de plus de 60,13 % par rapport à la baseline MPT, temps de planification moyen de 0,11 seconde, taux de succès de 99,60 %. Ces métriques, si elles se confirment en dehors du cadre simulé des benchmarks, représentent un gain opérationnel concret pour les intégrateurs d'AMR (autonomous mobile robots) en environnements industriels complexes : la planification déterministe à 0,11 s ouvre la voie à une navigation réactive sans les aléas des algorithmes d'échantillonnage stochastiques comme RRT ou PRM, qui peinent dans les espaces à forte densité d'obstacles. La correction topologique via l'homologie persistante est une approche encore rare dans la robotique mobile, empruntée à l'analyse de données topologiques, et son intégration dans une boucle de planification temps réel est techniquement non triviale. Il convient cependant de noter que le papier est un preprint non relu par les pairs, et que les résultats sont présentés sur des scénarios de benchmark sans déploiement terrain rapporté. La planification de chemin pour robots mobiles est un problème ouvert depuis les travaux fondateurs sur RRT (LaValle, 1998) et PRM. Les approches hybrides apprentissage-planification classique ont connu un regain d'intérêt avec les travaux sur les Motion Planning Transformers (MPT), qui servent ici de baseline. Dans le paysage concurrentiel, des acteurs comme Boston Dynamics (pour la navigation Spot), MiR, ou les équipes de recherche de NVIDIA Isaac Lab travaillent sur des pipelines similaires. Le CP-RPN se positionne comme une brique d'accélération modulaire, potentiellement intégrable à des stacks ROS2 existants. Les prochaines étapes attendues sont une validation sur hardware réel et des benchmarks en environnement dynamique.

RecherchePaper
1 source
Approximation de la sécurité sans oracle de sécurité via la commande prédictive par modèle
14arXiv cs.RO 

Approximation de la sécurité sans oracle de sécurité via la commande prédictive par modèle

Des chercheurs ont publié sur arXiv (référence 2510.20955v2) un algorithme permettant de vérifier la sécurité des décisions d'un robot mobile sans disposer d'un oracle de sécurité formel. Les approches classiques exigent soit des contraintes explicitement modélisées, soit des données annotées manuellement comme sûres ou dangereuses, deux méthodes coûteuses en ingénierie et sources d'erreurs. L'algorithme proposé contourne ce besoin via un simulateur : avant d'exécuter une action, le système la projette dans le simulateur vers un état futur, puis utilise l'algorithme Model-Predictive Path Integral (MPPI) pour vérifier l'existence d'un chemin de retour vers un état antérieur de la trajectoire. Sous une hypothèse d'invariance positive sur l'espace des états dangereux, si ce chemin de retour existe, l'état courant est mathématiquement garanti hors de la zone à risque. Les expériences montrent que la méthode approche les performances d'un oracle réel, en limitant notamment les faux négatifs, c'est-à-dire les cas où un état dangereux serait classifié à tort comme sûr. L'enjeu pratique est réel pour le déploiement des AMR (Autonomous Mobile Robots) en environnements industriels non structurés. La dépendance aux annotations manuelles de sécurité constitue un goulot d'étranglement majeur : chaque changement de site ou de configuration peut invalider les contraintes précédemment formulées. En exploitant les contraintes implicites déjà encodées dans les simulateurs physiques modernes, cette approche rend les systèmes de contrôle sûr plus généralisables, sans réécriture à chaque nouveau déploiement. Éliminer les faux négatifs est critique : c'est le scénario où un robot exécute une action jugée sûre à tort, avec des conséquences potentiellement irréversibles en conditions réelles. MPPI est un algorithme de planification par échantillonnage stochastique, initialement développé à Georgia Tech dans les travaux de Grady Williams et Evangelos Theodorou, et depuis repris dans de nombreux travaux sur la navigation autonome et les véhicules sans conducteur. Son utilisation ici comme outil de vérification de réversibilité plutôt que de planification directe constitue l'originalité méthodologique centrale de la contribution. Le travail s'inscrit dans un courant de recherche actif sur la sécurité sans supervision dense, aux côtés des Control Barrier Functions (CBF) appris par données et du safe reinforcement learning. L'article reste une contribution académique avec résultats en simulation uniquement, sans partenaire industriel ni déploiement annoncé. La prochaine étape naturelle serait une validation sur hardware réel dans des environnements aux contraintes implicites complexes et une comparaison quantitative avec des méthodes CBF classiques sur des benchmarks standardisés.

RecherchePaper
1 source
Exploration multi-étages pour robots terrestres via un graphe atteignable incrémental et des priors structurels
15arXiv cs.RO 

Exploration multi-étages pour robots terrestres via un graphe atteignable incrémental et des priors structurels

Des chercheurs ont publié sur arXiv (réf. 2605.23350) un framework d'exploration autonome multi-étages pour robots terrestres, baptisé "incremental reachable graph". Le problème adressé est concret : les cartes 2D et 2.5D classiques, qui constituent la base de la quasi-totalité des systèmes SLAM embarqués aujourd'hui, sont incapables de représenter des surfaces traversables superposées comme les escaliers, les rampes ou les paliers intermédiaires. La méthode propose de construire un graphe clairsemé sur les surfaces d'appui atteignables, avec des éléments "tentatives" permettant de maintenir une connectivité plausible même en conditions d'observation sparse. Pour franchir un étage inexploré, le système projette des "task-zone priors" depuis le niveau déjà cartographié afin d'initialiser un graphe hypothétique sur l'étage cible, puis le réconcilie progressivement avec les observations réelles. Un planificateur hiérarchique raisonne ensuite conjointement sur les structures confirmées et hypothétiques pour guider l'exploration globale. Les expériences rapportées combinent simulation et validation embarquée en conditions réelles, avec des gains mesurés en efficacité d'exploration et en complétude de cartographie face aux baselines évaluées. L'enjeu industriel est direct pour les intégrateurs d'AMR (Autonomous Mobile Robots) opérant dans des environnements multi-niveaux : entrepôts à mezzanines, hôpitaux, usines avec niveaux de production distincts. La majorité des flottes commerciales actuelles, y compris celles de MiR, Locus Robotics ou Exotec, restent confinées à un seul niveau ou nécessitent une cartographie manuelle de chaque étage. Un système capable d'auto-explorer et de transférer des connaissances topologiques entre niveaux réduirait significativement le coût de déploiement initial. La contribution théorique clé est la notion de graphe hypothétique initialisé par prior structurel, qui évite le problème classique de l'exploration "à l'aveugle" d'un étage inconnu. Cette problématique de navigation multi-étages est étudiée depuis une dizaine d'années, notamment via les cartes d'élévation 2.5D et les volumes OctoMap 3D, mais ces approches peinent à produire des frontières d'exploration exploitables dans des environnements cloisonnés. Le preprint ne mentionne pas d'affiliation institutionnelle explicite dans l'abstract disponible, ni de plateforme robotique précise utilisée pour les tests réels. Il s'agit à ce stade d'un résultat de recherche, pas d'un système commercialisé ou en pilote industriel. La prochaine étape naturelle serait une validation à plus grande échelle sur des plateformes comme Spot (Boston Dynamics) ou des robots à roues avec capacité de franchissement d'escaliers, un segment encore émergent sur lequel des acteurs comme ANYbotics ou Ascento positionnent leurs offres.

UEImpact indirect : la problématique adressée concerne des opérateurs AMR comme Exotec dont les flottes restent aujourd'hui confinées à un seul niveau, mais le travail reste un preprint sans affiliation ou partenariat européen identifié.

RecherchePaper
1 source
IA incarnée sous contrôle : gouvernance à l'exécution pour agents contraints par des politiques
16arXiv cs.RO 

IA incarnée sous contrôle : gouvernance à l'exécution pour agents contraints par des politiques

Des chercheurs ont publié sur arXiv (2604.07833) un cadre architectural pour la gouvernance d'exécution des agents incarnés, ces systèmes IA capables d'agir sur des robots, outils ou environnements physiques. La proposition centrale est une couche de gouvernance dédiée, externe à la boucle d'inférence de l'agent, chargée de cinq fonctions : vérification de politiques, admission de capacités, surveillance d'exécution, gestion des rollbacks et déclenchement d'override humain. Cette architecture formalise une frontière de contrôle entre l'agent incarné, des modules de capacité baptisés ECMs (Embodied Capability Modules) et la couche de gouvernance runtime. Les auteurs ont validé l'approche sur 1 000 essais de simulation randomisés couvrant trois dimensions de gouvernance : taux d'interception des actions non autorisées à 96,2 %, réduction des continuations non sécurisées de 100 % à 22,2 % en cas de dérive d'exécution, et 91,4 % de récupération avec conformité totale aux politiques, tous significativement supérieurs aux baselines testés (p<0,001). L'enjeu dépasse la robotique académique. À mesure que des agents IA obtiennent une autorité d'exécution réelle sur des bras industriels, des AMR (Autonomous Mobile Robots) ou des systèmes cyber-physiques, leur contrôlabilité devient un problème d'ingénierie système critique. L'approche dominante actuelle consiste à enfouir la logique de sécurité à l'intérieur de la boucle agent, ce qui rend l'audit difficile et la standardisation quasi impossible dans des environnements réglementés (santé, industrie critique). En externalisant la gouvernance dans une couche séparée, les auteurs proposent un modèle où la politique d'usage peut être modifiée ou vérifiée sans toucher aux poids du modèle, répondant à un besoin concret des intégrateurs industriels qui composent avec plusieurs fournisseurs et des référentiels de sécurité imposés par leurs clients. Ce papier s'inscrit dans un mouvement plus large de "safety at deployment", distinct de l'alignment par entraînement (RLHF, Constitutional AI). Il dialogue avec les architectures de contrôle comme ROS 2 et les travaux sur les systèmes multi-agents à responsabilité distribuée. Le contexte concurrentiel est direct : OpenAI, Google DeepMind, Figure AI, Physical Intelligence et Sanctuary AI développent tous des agents incarnés à capacité d'exécution croissante, mais la gouvernance runtime reste un angle mort industriel. Une telle architecture trouverait une application prioritaire dans les déploiements d'humanoïdes en environnement contrôlé, entrepôts ou lignes d'assemblage, où les opérateurs exigent des garanties d'auditabilité que les architectures end-to-end ne fournissent pas encore.

UEL'architecture de gouvernance externe proposée répond directement aux exigences d'auditabilité et de traçabilité de l'AI Act pour les systèmes d'IA à haut risque, offrant aux intégrateurs robotiques européens un cadre de référence concret pour démontrer la conformité de leurs agents incarnés sans modifier les poids des modèles.

RechercheOpinion
1 source
Coordination multi-robots fédérée sans fragmentation multi-agents intra-robot
17arXiv cs.RO 

Coordination multi-robots fédérée sans fragmentation multi-agents intra-robot

Une équipe de chercheurs a publié sur arXiv (arXiv:2604.11028v2) une architecture de coordination de flottes de robots baptisée Federated Single-Agent Robotics (FSAR). Le principe central s'oppose à une tendance croissante dans la robotique multi-robots : plutôt que de fragmenter chaque robot en plusieurs agents internes spécialisés (approche multi-agent intra-robot), FSAR préserve chaque unité comme un agent unique cohérent, doté de son propre runtime persistant, de son périmètre de politique locale et de son autorité de récupération autonome. La coordination inter-robots s'effectue au niveau de la flotte par fédération, via des registres partagés d'Embodied Capability Modules (ECM), de la délégation de tâches entre robots, une attribution d'autorité sensible aux politiques, et des protocoles de récupération en couches hiérarchiques. Sur des scénarios multi-robots représentatifs, les auteurs mesurent des gains statistiquement significatifs : effet de taille d=2.91 (p<0.001) pour la localité de gouvernance face au contrôle centralisé, et d=4.88 (p<0.001) pour le confinement des défaillances face aux architectures fortement décomposées. Pour les intégrateurs déployant des flottes d'AMR (Autonomous Mobile Robots) en entrepôt ou en environnement industriel, le choix de l'architecture de coordination impacte directement la robustesse opérationnelle. La thèse de FSAR est que la fragmentation intra-robot génère des conflits d'autorité, complique la récupération après panne et dilue la traçabilité des décisions. En maintenant un agent unique par robot, les politiques restent localement auditables, les pannes confinées, et la supervision humaine hiérarchique praticable à l'échelle de la flotte. Ces résultats sont toutefois issus de scénarios simulés qualifiés de "représentatifs" et non d'un déploiement physique documenté, ce qui limite pour l'instant la portée industrielle des conclusions. Le papier s'inscrit dans un débat architectural qui s'intensifie avec la montée en puissance des flottes humanoïdes (Figure AI, Agility Robotics, Apptronik) et des systèmes AMR à grande échelle. Les approches concurrentes, notamment les pipelines LLM/VLA qui décomposent chaque robot en sous-agents spécialisés, offrent davantage de flexibilité mais au prix d'une complexité de gouvernance croissante, selon les auteurs. En Europe, des acteurs comme Exotec (flotte Skypod déployée chez Decathlon et Cdiscount) ou Enchanted Tools (robot Miroka) sont directement concernés par ces choix architecturaux de fond. Le papier est une préprint arXiv en version 2, non encore soumise à ICRA, IROS ou CoRL ; la prochaine étape naturelle serait une validation expérimentale sur plateforme physique réelle.

UEExotec (flotte Skypod chez Decathlon et Cdiscount) et Enchanted Tools sont explicitement identifiés comme directement concernés par ces choix d'architecture de coordination de flotte, ce qui pourrait orienter leurs décisions techniques à moyen terme.

RecherchePaper
1 source
Raisonnement d'ordre supérieur pour des opérations collaboratives de robots mobiles sans communication
18arXiv cs.RO 

Raisonnement d'ordre supérieur pour des opérations collaboratives de robots mobiles sans communication

Des chercheurs présentent un cadre de planification épistémique dynamique permettant à des robots mobiles de se coordonner sans aucun échange de messages entre agents (arXiv:2605.21901). L'architecture repose sur des particules de croyances d'ordre supérieur : chaque robot modélise non seulement l'état du monde, mais aussi ce que ses coéquipiers croient de cet état, et ainsi de suite en cascade. Ces croyances sont mises à jour par inférence bayésienne, et un arbre de comportements sélectionne les actions en anticipant les décisions probables des voisins. Un contrôleur MPPI (Model Predictive Path Integral) temporellement conscient traduit ensuite ce raisonnement en trajectoires basse fréquence adaptées à l'observabilité partielle. Testée en simulation et sur robots physiques, l'approche réduit le temps de complétion des tâches par rapport à une baseline de raisonnement du premier ordre, sans que l'abstract précise la taille des flottes ni les conditions exactes des essais. L'enjeu est direct pour les intégrateurs de flottes d'AMR (Autonomous Mobile Robots) en logistique ou en industrie : les architectures actuelles supposent un orchestrateur central ou un réseau Wi-Fi stable, et toute dégradation du signal dégrade la coordination collective. Un mécanisme de coordination implicite fondé sur la logique épistémique ouvre la voie à des déploiements plus résilients dans des environnements RF-dégradés, souterrains ou à bande passante contrainte. L'approche valide également l'opérationnalisation de la logique épistémique, longtemps cantonnée à l'IA symbolique, dans une boucle de contrôle temps réel sur hardware physique, ce qui n'était pas acquis à cette échelle. La coordination décentralisée sans communication est un problème ouvert depuis les systèmes multi-agents des années 1990, mais son implémentation sur robots réels est restée marginale au profit des solutions centralisées. Les approches concurrentes incluent les champs de potentiel artificiel, l'optimisation distribuée (ADMM, consensus) et l'apprentissage par renforcement multi-agents (MARL). Ce travail se distingue par le couplage inhabituel entre raisonnement épistémique symbolique et contrôle continu par MPPI. Les suites naturelles attendues : une évaluation à plus grande échelle (cinq robots ou plus), des comparaisons directes avec des méthodes MARL de référence, et une analyse de la complexité computationnelle du raisonnement d'ordre supérieur en temps réel, point critique pour un déploiement industriel viable.

UEBénéfice indirect pour les intégrateurs européens de flottes AMR (logistique, industrie) opérant dans des environnements RF-dégradés, mais aucun acteur français ou européen n'est impliqué dans cette recherche.

RecherchePaper
1 source
Parallel OctoMapping : un cadre évolutif pour la planification de trajectoires en navigation autonome
19arXiv cs.RO 

Parallel OctoMapping : un cadre évolutif pour la planification de trajectoires en navigation autonome

Une équipe de chercheurs a publié sur arXiv (référence 2603.22508v2, mis à jour en mai 2026) une méthode de cartographie baptisée Parallel OctoMapping (POMP), destinée à améliorer la planification de trajectoires dans les systèmes de navigation autonome. POMP s'appuie sur le framework OctoMap, une représentation volumétrique de l'espace libre et occupé largement utilisée en robotique mobile. La contribution centrale consiste à raffiner la représentation de l'espace libre à résolution de grille d'occupancy fixe, tout en préservant la fidélité de la carte et en exploitant le calcul multi-thread. Les auteurs soutiennent, sous réserve de vérification indépendante, qu'il s'agirait de la première méthode à combiner ces deux propriétés à résolution constante. L'enjeu pratique concerne directement les intégrateurs de robots mobiles et les déploiements AMR (Autonomous Mobile Robots) en environnements encombrés. Les méthodes classiques à résolution fixe produisent des représentations d'obstacles trop conservatives, ce qui génère soit des trajectoires sous-optimales, soit des échecs de planification dans des espaces denses. POMP prétend améliorer simultanément le taux de succès de la planification et la longueur des chemins calculés, tout en réduisant substantiellement le coût computationnel grâce au parallélisme. Si ces gains se confirment sur des benchmarks indépendants, la méthode pourrait s'insérer dans des pipelines existants utilisant des planificateurs A* ou équivalents, sans refonte architecturale majeure. OctoMap est un standard de facto dans la navigation robotique depuis les travaux d'Hornung et al. (2013), massivement adopté dans ROS et ROS2 pour les drones, véhicules autonomes et robots d'entrepôt. POMP se positionne comme une extension drop-in plutôt qu'un remplacement, ce qui réduit la barrière à l'adoption. Sur le plan académique, la cartographie haute performance mobilise également des approches concurrentes comme VDB-EDF (NVIDIA), les représentations neurales implicites de type NeRF-Nav, ou les grilles probabilistes hiérarchiques. À ce stade, POMP reste un preprint non évalué par les pairs, sans implémentation open source ni benchmark standardisé publiquement référencé dans l'abstract disponible.

RecherchePaper
1 source
Apprentissage par renforcement guidé par référence pour la navigation autonome de robots humanoïdes en terrain variable
20arXiv cs.RO 

Apprentissage par renforcement guidé par référence pour la navigation autonome de robots humanoïdes en terrain variable

Une équipe de recherche publie sur arXiv (référence 2605.15517) une méthode d'entraînement de politiques de locomotion par apprentissage par renforcement (RL) pour robots humanoïdes, dans laquelle les trajectoires de référence sont adaptées dynamiquement à la géométrie du terrain pendant l'entraînement. Concrètement, le système génère en boucle des trajectoires de référence contrôlables en SE(2), l'espace de déplacement planaire, en projetant les appuis de pied sur des zones d'appui valides et en ajustant les trajectoires du pied oscillant et du centre de masse selon le relief. L'interface exposée est un vecteur de vitesse SE(2) standard, directement compatible avec les planificateurs de navigation autonome existants. Côté hardware, les chercheurs ont intégré cette politique avec un planificateur MPC (Model Predictive Control) couplé à des fonctions de barrière de contrôle (CBF), et démontré une navigation autonome en boucle fermée sur plus de 70 mètres en extérieur sur le robot Unitree G1, incluant des terrains accidentés et des escaliers consécutifs, avec l'ensemble du calcul et de la perception embarqués. Ce résultat est notable parce qu'il attaque directement le problème du "reality gap" dans la locomotion humanoïde sur terrain non structuré : en conditionnant les trajectoires de référence au terrain dès la phase de simulation, la politique apprend des comportements footholds-aware plutôt que des mouvements génériques dégradés au contact du sol réel. L'exposition d'une interface SE(2) propre signifie que cette politique s'insère sans friction dans un stack de navigation autonome standard, celui qu'utilisent déjà les AMR (autonomous mobile robots) industriels, sans couche d'adaptation supplémentaire. Pour un intégrateur ou un équipementier, c'est une architecture qui réduit la dette de middlewares entre planification de chemin et exécution de locomotion. Le Unitree G1 est un humanoïde à faible coût (environ 16 000 dollars) dont Unitree, fabricant chinois, a multiplié les variantes depuis 2024. Le domaine de la locomotion humanoïde guidée par trajectoires de référence est aussi exploré par des laboratoires comme CMU, ETH Zurich (ANYbotics, Legged Gym), et des équipes comme celles de Boston Dynamics ou Agility Robotics, qui privilégient des approches similaires sim-to-real. Ce travail reste une démonstration académique, parcours sélectionnés, conditions contrôlées, et n'est pas associé à une annonce de déploiement commercial. Les prochaines étapes logiques incluent des tests à plus grande échelle de variabilité de terrain et l'intégration avec des planificateurs 3D.

HumanoïdesPaper
1 source
Architecture hybride intelligente à base de LLM pour l'ordonnancement des tâches robotiques
21arXiv cs.RO 

Architecture hybride intelligente à base de LLM pour l'ordonnancement des tâches robotiques

Une équipe de chercheurs a publié sur arXiv (arXiv:2605.15486, mai 2026) un framework hybride exploitant des grands modèles de langage (LLM) pour orchestrer la planification de tâches de robots de chantier. L'architecture repose sur deux agents LLM fonctionnant en parallèle : un agent générateur basé sur GPT-4 (OpenAI) chargé de produire les séquences de tâches, et un agent superviseur interchangeable parmi Gemma 3 (Google DeepMind), Llama 4 (Meta) ou Mistral 7b, chargé de valider et corriger les plannings générés. Le système intègre une interface en langage naturel (NLP) permettant aux professionnels du bâtiment de communiquer directement leurs contraintes opérationnelles, et peut s'adapter en temps réel à des conditions imprévues sur site. Les résultats sont évalués sur un scénario simplifié avec des métriques quantitatives d'efficacité temporelle et d'utilisation des ressources. L'intérêt principal de cette approche réside dans la combinaison d'un modèle de raisonnement puissant (GPT-4) avec un modèle superviseur plus léger et remplaçable, ce qui réduit potentiellement le coût d'inférence tout en maintenant une validation en boucle fermée. Pour les intégrateurs de robotique dans le BTP, la couche NLP représente une piste concrète pour réduire la dépendance à des opérateurs spécialisés en programmation robot. Cela dit, l'évaluation reste limitée à un scénario dit "straightforward", ce qui ne permet pas de conclure sur la robustesse en conditions réelles de chantier, où la multiplicité des aléas (retards livraison, obstacles, météo) constitue le vrai défi. La validité industrielle de la méthode reste à démontrer à plus grande échelle. La planification automatisée de tâches multi-robots dans la construction est un axe actif depuis plusieurs années, notamment avec les travaux sur les systèmes BIM-to-robot et les AMR (autonomous mobile robots) de chantier. Des acteurs comme Boston Dynamics (avec Spot en inspection), Hilti (robots d'ancrage) ou NLink explorent déjà des formes de programmation par intention. En Europe, des initiatives comme Versatile (projet H2020) ont tracé des pistes similaires. Ce preprint s'inscrit dans une tendance plus large d'utilisation des VLA (Vision-Language-Action models) et des LLM comme couche de planification symbolique au-dessus de robots exécutants, une approche que des laboratoires comme Stanford (Mobile ALOHA) et CMU poussent en parallèle. Les prochaines étapes attendues seraient une validation sur chantier réel et une comparaison formelle entre les différents agents superviseurs testés.

UEApproche potentiellement exploitable par des intégrateurs robotiques européens actifs dans le BTP (Versatile/H2020), mais sans validation sur chantier réel ni déploiement en Europe à ce stade.

RechercheOpinion
1 source
Pourquoi les fondateurs les plus prospères en robotique sont des penseurs systémiques
22Robotics Business Review 

Pourquoi les fondateurs les plus prospères en robotique sont des penseurs systémiques

L'épisode 244 du podcast The Robot Report, publié cette semaine, met en vedette Ajay Agarwal, associé chez Bain Capital Ventures (BCV), où il investit depuis plus de vingt ans dans des sociétés technologiques en phase précoce, avec un focus sur les logiciels, l'IA, la logistique et l'automatisation industrielle. L'entretien couvre son thèse d'investissement en robotique, sa méthode pour identifier les fondateurs à fort potentiel, et son regard sur la montée en puissance des robots humanoïdes. L'émission aborde également les actualités de la semaine : la publication des lauréats 2026 des RBR50 Robotics Innovation Awards, la nouvelle version Stretch 4 de Hello Robot (plus grande, plus rapide et plus puissante que ses prédécesseurs), et le dévoilement de la SmartBay d'Automated Tire, une station autonome de changement de pneus. La thèse centrale d'Agarwal, implicite dans le titre de l'épisode, est que les fondateurs les plus performants en robotique sont des "systems thinkers" : ils ne conçoivent pas des composants isolés, mais des systèmes complets intégrant mécanique, software, logistique et modèle économique. Ce cadre analytique, forgé au fil de deux décennies d'investissements, a une pertinence directe pour les décideurs industriels et les intégrateurs : il suggère que la sélection de partenaires technologiques devrait se faire sur la capacité à penser bout-en-bout, pas uniquement sur la performance technique d'un sous-système. Dans un marché où les démos restent souvent déconnectées de la réalité opérationnelle, ce type de discernement investisseur constitue un signal utile sur les entreprises réellement bancables à l'échelle. Agarwal est notamment connu pour avoir piloté l'investissement historique de BCV dans Kiva Systems, la société de robots de manutention entrepôt rachetée par Amazon en 2012 pour 775 millions de dollars et rebaptisée Amazon Robotics, devenue depuis une référence structurante du secteur AMR (autonomous mobile robots). Cette prise de position précoce illustre sa capacité à identifier des changements de paradigme avant qu'ils ne deviennent évidents. Aujourd'hui, il observe de près l'essor des humanoïdes, un segment dominé par Figure AI, 1X Technologies, Agility Robotics (filiale Amazon), Boston Dynamics et Tesla Optimus, avec des acteurs européens comme Enchanted Tools ou Wandercraft encore à l'écart des grands cycles de financement américains. La prochaine étape concrète mentionnée dans l'épisode est le Robotics Summit & Expo 2026, co-organisé par The Robot Report, qui réunit plus de 70 intervenants confirmés issus de Tesla, Toyota Research Institute, AWS ou Brain Corp, et constitue un baromètre sectoriel pour les mois à venir.

UELa mention d'Enchanted Tools et Wandercraft comme acteurs européens encore à l'écart des grands cycles de financement américains constitue un signal indirect sur le déficit de capital-risque en Europe pour les humanoïdes.

BusinessActu
1 source
Seacon Logistics choisit Dexory pour renforcer la continuité opérationnelle dans 90 000 m² d'entrepôts
23Robotics & Automation News 

Seacon Logistics choisit Dexory pour renforcer la continuité opérationnelle dans 90 000 m² d'entrepôts

Seacon Logistics, opérateur logistique néerlandais, a retenu la solution DexoryView de la startup britannique Dexory pour couvrir deux entrepôts situés à Maasbree, aux Pays-Bas (Zonneveld 1 et Zonneveld 3). Le déploiement porte sur environ 90 000 m² de rayonnages dédiés à la manutention de marchandises générales et de produits de grande consommation (FMCG) en conditions ambiantes. Aucune date de mise en service ni tarification n'ont été communiquées dans l'annonce. DexoryView repose sur des robots AMR (autonomous mobile robots) qui parcourent les allées de manière autonome et scannent en continu les stocks en rayonnage, alimentant une couche analytique en quasi temps réel. Pour un opérateur gérant des volumes FMCG à rotation rapide, l'enjeu est concret : réduire les écarts d'inventaire, les erreurs de localisation et les comptages manuels coûteux, tout en maintenant la cadence opérationnelle. Le déploiement sur deux sites simultanément suggère une phase de standardisation plutôt qu'un pilote exploratoire, ce qui est notable. Fondée en 2021 à Londres, Dexory a levé environ 34 millions de dollars en série A en 2023 et cible prioritairement les grands entrepôts logistiques européens. Sur le créneau du scanning d'inventaire automatisé, elle concurrence Gather AI (drones), Corvus (drones aussi) et des approches RFID fixes. Seacon Logistics, qui opère plusieurs millions de m² de surface logistique en Europe du Nord, représente une référence sectorielle significative pour Dexory dans le segment FMCG, un marché où la précision d'inventaire conditionne directement les niveaux de service contractuels.

UELe déploiement de DexoryView sur 90 000 m² d'entrepôts néerlandais de Seacon Logistics ancre Dexory comme référence sectorielle sur le marché logistique FMCG européen, accélérant potentiellement l'adoption des AMR d'inventaire dans les grands opérateurs logistiques de l'UE.

FR/EU ecosystemeActu
1 source
GreyOrange lance un simulateur d'entrepôt par IA pour modéliser les performances et les coûts de l'automatisation
24Robotics & Automation News 

GreyOrange lance un simulateur d'entrepôt par IA pour modéliser les performances et les coûts de l'automatisation

GreyOrange a lancé GreyMatter Foundry, une plateforme de simulation d'entrepôts destinée aux opérateurs logistiques souhaitant modéliser des déploiements d'automatisation avant tout engagement sur site. L'outil regroupe dans un environnement unique la conception des flux d'entrepôt, la planification des layouts et le dimensionnement des systèmes d'automatisation. Il supporte la modélisation de flottes hétérogènes de robots, permettant ainsi d'estimer les coûts opérationnels et de prédire les performances système en amont de l'implémentation physique. Aucun chiffre précis sur les temps de cycle, les volumes traités ou les tarifs de la plateforme n'a été communiqué lors de cette annonce. Pour les intégrateurs et les directeurs logistiques, ce type d'outil répond à un problème récurrent : les déploiements d'AMR (autonomous mobile robots) en environnement réel génèrent des coûts d'ajustement post-installation significatifs lorsque le dimensionnement initial est mal calibré. Un simulateur intégré au même écosystème logiciel que l'orchestration des robots réduit théoriquement le gap entre conception et exploitation, à condition que les modèles physiques sous-jacents soient suffisamment fidèles, ce que GreyOrange n'a pas encore documenté publiquement. GreyOrange, fondée en 2011 et dont le siège est à Atlanta, s'est imposée dans la logistique automatisée via sa suite GreyMatter d'orchestration multi-robots et ses robots Ranger. La société concurrence des acteurs comme Symbotic, Locus Robotics, et, dans l'espace simulation, des plateformes spécialisées comme Anylogic ou les outils intégrés de Dematic. GreyMatter Foundry s'inscrit dans une tendance plus large du secteur à proposer des jumeaux numériques pré-déploiement, une approche que Honeywell Intelligrated et KION Group ont également développée ces deux dernières années.

IndustrielOpinion
1 source
PECMAN : navigation collaborative multi-agents par perception en environnements inconnus
25arXiv cs.RO 

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

Des chercheurs ont publié sur arXiv (réf. 2605.09344) PECMAN, un système de navigation collaborative multi-agents conçu pour des environnements inconnus et dynamiques. L'algorithme s'appuie sur SMART-3D, un planificateur de trajectoires fondé sur la structure RRT* (Rapidly-exploring Random Tree) capable de reconfigurer en temps réel son arbre de planification dès qu'un obstacle ou une nouvelle structure est détecté : plutôt que de reconstruire l'arbre depuis zéro, SMART-3D élague les noeuds et arêtes invalidés, puis répare les sous-arbres déconnectés à des points critiques appelés "hot-nodes". PECMAN étend ce mécanisme à la coopération multi-agents via deux stratégies combinées : une morphologie d'arbre distribuée, où chaque robot replanifie localement, et une perception partagée, par laquelle chaque agent diffuse les structures nouvellement découvertes à ses coéquipiers, leur permettant de replanifier proactivement même dans des zones encore inexplorées. Évalué sur 28 000 simulations couvrant sept scénarios 2D distincts, le système atteint jusqu'à 52 % de réduction du temps de complétion collective avec un taux de succès proche de 100 %. Les expériences ont également été validées sur deux robots autonomes réels dans un environnement de bâtiment. La contribution architecturale centrale est la perception partagée sans coordinateur central : chaque agent enrichit la carte collective en temps réel, ce qui réduit les replanifications redondantes et la latence de réaction de la flotte entière. Pour les intégrateurs de systèmes AMR (Autonomous Mobile Robots) en logistique ou en inspection industrielle, c'est précisément le verrou qui bloque le passage à l'échelle des flottes dans des environnements semi-structurés. La validation physique, même limitée à deux robots, apporte un début de réponse au problème classique du sim-to-real gap, l'un des obstacles majeurs au déploiement de planificateurs collaboratifs en conditions réelles. La réduction de 52 % du temps de complétion est prometteuse, mais mérite d'être interprétée avec prudence : les simulations 2D ne capturent pas la complexité des environnements 3D, et les scénarios de test ne sont pas détaillés dans l'abstract. Les approches multi-agents existantes comme CBS (Conflict-Based Search) ou ORCA supposent généralement des cartes connues à l'avance, ce qui les rend difficilement applicables à une exploration progressive. SMART-3D avait résolu ce problème pour un agent unique ; PECMAN en est l'extension coopérative naturelle. Aucun partenaire industriel ni déploiement commercial n'est mentionné dans la publication, qui reste une contribution académique. Les prochaines étapes logiques seraient des tests sur des flottes plus larges et en environnements 3D réels, conditions nécessaires pour envisager un transfert vers des entrepôts multi-niveaux ou des bâtiments industriels complexes, où les systèmes AMR actuels peinent encore à coordonner leur navigation de façon autonome.

RecherchePaper
1 source
LDROBOT Robotics bondit de 103 % lors de son introduction en bourse à Hong Kong, valorisée à 2,4 milliards de dollars
26Pandaily 

LDROBOT Robotics bondit de 103 % lors de son introduction en bourse à Hong Kong, valorisée à 2,4 milliards de dollars

LDROBOT Robotics, fabricant de capteurs pour la robotique basé à Shenzhen, a fait ses débuts à la Bourse de Hong Kong le 9 mai 2026 avec une hausse de 103 %, clôturant à HK$53,5 par action et atteignant une capitalisation boursière de HK$17,8 milliards (environ 2,4 milliards de dollars). L'introduction en bourse a levé HK$878,7 millions (~113 millions de dollars), avec une sursouscription du compartiment retail de 6 707 fois, l'une des plus élevées enregistrées pour une IPO hongkongaise en 2026. La société fournit principalement des capteurs LiDAR à technologie DTOF (Direct Time-of-Flight) à des fabricants d'aspirateurs robots et d'appareils domestiques autonomes, dont Ecovacs et Dreame, et revendique un déploiement de sa technologie dans plus de 6 millions de robots à l'échelle mondiale. L'engouement des investisseurs traduit un pari structurel sur la couche perception de la robotique, distincte du hardware locomoteur ou du software d'IA. Le LiDAR DTOF est un composant critique pour la navigation autonome à courte portée dans les robots de service et les AMR (Autonomous Mobile Robots) d'intérieur. La valorisation atteinte dès le premier jour signale que les marchés capitalisent désormais sur les fournisseurs de composants robotiques, pas seulement sur les intégrateurs finaux ou les plateformes logicielles. LDROBOT devient la deuxième entreprise robotique cotée à Shenzhen après UBTECH, ce qui consolide le Guangdong comme épicentre de l'écosystème hardware chinois. Il convient toutefois de noter que la performance boursière du premier jour reflète en partie une demande comprimée par la sursouscription et ne garantit pas une valorisation stable à moyen terme. La société a été fondée par Zhou Wei, entrepreneur en série de 85 ans et ancien de l'Université des Sciences et Technologies de Huazhong. Il avait auparavant dirigé Shenzhen Lexing Tianxia dans le secteur des trottinettes électriques à équilibrage, avant de pivoter vers les capteurs robotiques et d'atteindre la première place mondiale en volume de livraisons de LiDAR DTOF. Le tour de table pré-IPO associait des fonds institutionnels (Source Code Capital, China Unicom CICC Fund, Shenzhen Gaotou) à des investisseurs industriels comme New Hope Group, ainsi qu'à la holding personnelle de Wu Yongming, PDG d'Alibaba. Du côté concurrentiel, LDROBOT se positionne face à des acteurs comme Livox (filiale DJI) sur le LiDAR embarqué et à des fournisseurs coréens et japonais sur les marchés export, mais son ancrage dans l'écosystème robot domestique chinois lui confère un avantage de volume difficile à répliquer rapidement.

Chine/AsieOpinion
1 source
Livraison multi-agents avec correspondances multiples
27arXiv cs.RO 

Livraison multi-agents avec correspondances multiples

Des chercheurs ont publié sur arXiv (référence 2605.07835) un algorithme baptisé M2M (Many-to-Many Multi-Agent Pickup and Delivery) pour optimiser la coordination de flottes de robots dans des entrepôts automatisés. La majorité des travaux antérieurs sur le problème MAPD (Multi-Agent Pickup and Delivery) supposent qu'une tâche a un unique point de collecte et un unique point de dépôt, le paradigme dit "one-to-one". M2M s'attaque à la variante "many-to-many" : dans un entrepôt réel, un article identifié par son SKU (Stock Keeping Unit) peut être prélevé ou stocké à plusieurs emplacements, ce qui génère un problème d'affectation à quatre dimensions classé NP-difficile. L'équipe propose deux variantes : M2M, qui minimise la durée estimée de chaque tâche, et M2M-wSKU, qui intègre en plus la distribution physique des SKUs dans la fonction objectif. En simulation sur des opérations de 8 heures, M2M complète jusqu'à 22 000 tâches supplémentaires en moyenne par rapport aux meilleures méthodes existantes, selon les configurations d'environnement et la densité d'inventaire. Le gain de 22 000 tâches sur une journée simulée de 8 heures représente un saut de throughput significatif pour un entrepôt à forte rotation. Pour un intégrateur ou un COO industriel, cela se traduit directement en capacité de traitement d'ordres supplémentaires sans augmenter le parc de robots. L'enjeu théorique est tout aussi notable : la transition du paradigme one-to-one vers many-to-many reflète fidèlement la réalité des entrepôts modernes, où la redondance d'emplacements est un mécanisme délibéré de résilience logistique. Une limite mérite d'être soulignée : les simulations sur 8 heures ne capturent pas les pannes matérielles, la variabilité des temps de manipulation, ni les interactions humaines en zones mixtes. Sur le plan académique toutefois, M2M établit une nouvelle référence sur ce sous-problème MAPD jusqu'ici peu traité. Le MAPD est un champ de recherche actif depuis une quinzaine d'années, porté par l'essor des entrepôts automatisés et des systèmes AMR (Autonomous Mobile Robots). Les algorithmes classiques ciblaient des scénarios one-to-one correspondant aux premières architectures d'entrepôts, mais les systèmes industriels modernes opèrent quasi universellement en many-to-many. L'entreprise française Exotec, avec son système Skypod déployé chez plus de 400 clients dans 15 pays, incarne précisément cette réalité multi-emplacements, aux côtés d'acteurs comme Amazon Robotics, Geek+ ou AutoStore. La publication de M2M sur arXiv ouvre la voie à son intégration dans des frameworks open-source de planification multi-robots. Les prochaines étapes attendues incluent une validation sur environnements physiques et la prise en compte de contraintes temporelles réelles, telles que les fenêtres de livraison ou les priorités dynamiques de commande.

UEL'algorithme M2M pourrait être directement intégré dans des systèmes comme le Skypod d'Exotec, permettant d'augmenter le débit des entrepôts automatisés européens sans extension du parc de robots.

IndustrielPaper
1 source
Bi3 : un jeu de données biplateforme, biculturel et bipersonnel pour la navigation des robots sociaux
28arXiv cs.RO 

Bi3 : un jeu de données biplateforme, biculturel et bipersonnel pour la navigation des robots sociaux

Bi3 est un jeu de données pour la navigation sociale de robots en espaces contraints, publié en preprint sur arXiv en mai 2026. L'expérience place systématiquement un robot face à deux humains dans un espace de laboratoire restreint, avec 74 participants recrutés sur deux sites : un aux États-Unis, un en France. Le dataset totalise 10,5 heures de trajectoires avec vérité terrain pour humains et robots, des flux vidéo RGB et des évaluations subjectives des participants sur les performances du robot. Cinq algorithmes de navigation distincts ont été testés sur deux plateformes robotiques différentes, ce qui constitue une couverture algorithmique et matérielle inédite dans ce domaine. La navigation sociale en milieu dense reste l'un des verrous techniques majeurs de la robotique de service et de la logistique en environnement humain. Les benchmarks existants souffrent généralement d'un biais culturel marqué et d'une densité d'interaction artificiellement faible. Bi3 cible ces lacunes directement : la dimension biculturelle France/USA permet de tester si les comportements proximaux humains varient selon les normes sociales locales, une hypothèse rarement éprouvée empiriquement. Les métriques publiées, densité d'interaction et vélocité humaine, montrent une complexité comportementale supérieure aux datasets précédents, ce qui en fait un terrain d'évaluation plus exigeant pour les modèles de prédiction de mouvement et les politiques de contrôle de navigation. Ce dataset s'inscrit dans l'effort collectif de la communauté robotique pour réduire l'écart entre simulations et déploiements réels. La présence d'un site de collecte en France est notable : elle apporte une représentation européenne rare dans ce type de benchmark, où les données américaines ou asiatiques dominent historiquement. Bi3 est conçu comme une ressource ouverte pour entraîner des architectures VLA (Vision-Language-Action) et des politiques de navigation en espaces denses, ainsi que des modèles de prédiction de mouvement humain. À ce stade, il s'agit d'un preprint académique, pas d'un déploiement opérationnel. Les suites naturelles incluent l'intégration dans des benchmarks standardisés et l'utilisation pour affiner des politiques de navigation sur des AMR (Autonomous Mobile Robots) en environnement industriel ou hospitalier.

UELa présence d'un site de collecte en France apporte des données comportementales européennes dans un benchmark de navigation sociale, offrant une référence plus représentative pour calibrer des AMR déployés en milieu hospitalier ou industriel en Europe.

RecherchePaper
1 source
Planification robotique sous contraintes de ressources face à une incertitude mixte
29arXiv cs.RO 

Planification robotique sous contraintes de ressources face à une incertitude mixte

Des chercheurs présentent le CMDPST (Consumption Markov Decision Process with Set-valued Transitions), un cadre formel inédit permettant à un robot de planifier ses actions en tenant compte simultanément de deux types d'incertitudes : le bruit probabiliste mesurable et les inconnues structurellement non-quantifiables, tout en garantissant que le système ne tombe jamais à court de ressources opérationnelles (batterie, capacité de charge, quota de déplacements). Publiée sur arXiv en mai 2026 (réf. 2605.05797), la contribution couple ce modèle à une spécification de tâche exprimée en LTLf (logique temporelle linéaire sur traces finies), un formalisme permettant d'encoder des objectifs complexes avec des contraintes temporelles précises. Les auteurs proposent deux algorithmes de synthèse de stratégie : une méthode directe par déroulage d'états et une version optimisée par élagage de l'espace d'états, plus efficace en temps de calcul. Les expériences sont conduites sur un réseau de transport en entrepôt simulé, sans validation sur hardware réel à ce stade. La contribution adresse un angle mort récurrent dans la planification robotique industrielle : la plupart des approches existantes traitent soit l'incertitude probabiliste via les MDP classiques, soit les contraintes de ressources, rarement les deux ensemble. Dans les déploiements AMR (autonomous mobile robots) d'entrepôt, où une flotte doit honorer des missions tout en gérant niveaux de batterie et pannes imprévisibles, cette dualité est pourtant critique. Le cadre CMDPST offre aux intégrateurs une garantie formelle : la stratégie synthétisée ne laissera jamais un robot en panne sèche, même face à des perturbations non modélisées. C'est un argument solide pour des environnements industriels où l'interruption de service a un coût direct et mesurable. Ce type de planification sous contraintes mixtes s'inscrit dans un corpus plus large incluant la vérification probabiliste de modèles (outils PRISM, Storm) et la planification formelle par MDP. Les acteurs de la logistique automatisée comme Exotec (France) ou Hai Robotics, dont les flottes AMR évoluent dans des environnements partiellement inconnus, sont directement concernés par ces avancées théoriques. Côté alternatives académiques, le reinforcement learning robuste et le model predictive control probabiliste existent, mais sans les garanties formelles d'épuisement de ressources que revendique cette approche. La prochaine étape attendue est une implémentation sur robot physique pour évaluer concrètement le gap sim-to-real.

UEExotec (France) est explicitement citée comme acteur directement concerné par ces avancées théoriques, ses flottes AMR en entrepôt étant précisément le cas d'usage visé par les garanties formelles de non-épuisement des ressources du cadre CMDPST.

RecherchePaper
1 source
Apprentissage par renforcement basé sur un modèle pour le contrôle robotique via optimisation en ligne
30arXiv cs.RO 

Apprentissage par renforcement basé sur un modèle pour le contrôle robotique via optimisation en ligne

Des chercheurs ont publié sur arXiv (arXiv:2510.18518v2) un algorithme d'apprentissage par renforcement basé sur un modèle (MBRL) conçu pour contrôler des systèmes robotiques complexes directement dans le monde réel, sans passer par une phase de simulation intensive. L'approche construit un modèle de dynamique à partir des données d'interaction en temps réel, puis effectue des mises à jour de politique guidées par ce modèle appris. Les validations expérimentales ont été conduites sur deux plateformes distinctes : un bras d'excavatrice hydraulique et un bras robot souple. Dans les deux cas, l'algorithme atteint des performances comparables aux méthodes model-free en quelques heures d'entraînement, là où ces dernières réclament habituellement des millions d'interactions simulées. La robustesse de l'adaptation a également été évaluée sous conditions de charge utile (payload) aléatoire, avec des résultats stables malgré le changement de dynamique. L'enjeu principal est la réduction de ce que le secteur appelle le "sim-to-real gap" : l'écart entre les politiques apprises en simulation et leur comportement réel une fois déployées sur du matériel. Les pipelines dominants, adoptés aussi bien par des labos académiques que par des industriels comme Boston Dynamics ou Figure AI, reposent sur des millions de rollouts en simulation avant tout contact avec un robot physique, ce qui introduit un biais systématique difficile à corriger. Cet algorithme court-circuite cette étape en apprenant directement sur données réelles, avec une garantie formelle de progression : les auteurs démontrent des bornes de regret sous-linéaires (sublinear regret bounds) sous hypothèses d'optimisation stochastique en ligne, ce qui est rare dans la littérature MBRL appliquée à la robotique physique. Pour un intégrateur ou un industriel, cela se traduit par une réduction potentielle du temps de mise en service sur des tâches à dynamique variable (variation de charge, usure mécanique, changement de matériau). Ce travail s'inscrit dans un débat structurant du champ : model-based vs model-free RL pour la robotique physique. Les méthodes model-free comme PPO ou SAC dominent les benchmarks simulés mais peinent à s'adapter efficacement en production réelle. Des approches hybrides comme MBPO ou DreamerV3 ont tenté de combler cet écart, mais rarement validées sur des systèmes aussi hétérogènes qu'un bras hydraulique industriel et un manipulateur souple. La prochaine étape naturelle serait une validation sur des plateformes humanoïdes ou des AMR (autonomous mobile robots) à haute dimension, où les enjeux de sample efficiency sont directement liés aux coûts d'exploitation et à la durée de vie des actionneurs.

RecherchePaper
1 source
FORMULA : MPC de formation avec apprentissage de barrières neuronales pour la garantie de sécurité
31arXiv cs.RO 

FORMULA : MPC de formation avec apprentissage de barrières neuronales pour la garantie de sécurité

Une équipe de chercheurs propose FORMULA (FORmation MPC with neUral barrier Learning for safety Assurance), un framework de contrôle distribué pour systèmes multi-robots (MRS) publié sur arXiv (réf. 2604.04409v2). L'approche combine trois briques algorithmiques : du Model Predictive Control (MPC) pour la planification prédictive, des Control Lyapunov Functions (CLFs) pour garantir la stabilité de la formation, et des Control Barrier Functions (CBFs) implémentées sous forme de réseaux de neurones pour assurer la sécurité de manière décentralisée. L'objectif est de permettre à une flotte de robots de naviguer en formation dans des environnements encombrés et dynamiques, sans conception manuelle des contraintes de sécurité. Les résultats présentés sont issus de simulations uniquement ; aucun déploiement matériel n'est rapporté à ce stade. Le verrou technique adressé est réel : les approches MPC classiques pour la formation multi-robots peinent à passer à l'échelle, tandis que les CBFs, pourtant fondées mathématiquement pour l'enforcement de sécurité, sont difficiles à concevoir à la main pour des systèmes non-linéaires complexes. FORMULA automatise cette conception via l'apprentissage, ce qui réduit la charge de calcul en ligne et permet de résoudre les situations de blocage (deadlocks) en configuration dense. Pour un intégrateur ou un COO industriel, c'est le type de brique qui conditionne le passage de pilotes en cellule à des déploiements flotte réelle dans des entrepôts ou sur des sites logistiques. La formation en robotique mobile est un problème ouvert depuis les années 2000, et les approches MPC centralisées ont longtemps buté sur la scalabilité. Le contexte applicatif visé -- logistique entrepôt, transport de matériaux, réponse aux catastrophes -- est précisément celui où des acteurs comme Exotec (France) ou Locus Robotics opèrent avec des flottes d'AMR (Autonomous Mobile Robots) sans formation rigide. FORMULA se positionne donc sur un créneau de contrôle coordonné plus contraignant que les AMR classiques. La limite principale reste l'absence de validation sur hardware réel : le gap sim-to-real pour les CBFs neuronales, notamment en présence de bruit de capteurs et de latences réseau, n'est pas adressé dans ce preprint.

UESi les résultats se confirment sur hardware réel, des acteurs européens de la logistique robotisée (dont Exotec en France) pourraient intégrer ce type de brique de contrôle coordonné pour des flottes d'AMR en environnements denses, mais l'impact reste conditionnel à la validation sim-to-real.

RecherchePaper
1 source
Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace
32arXiv cs.RO 

Faut-il vraiment réinitialiser immédiatement ? Repenser la gestion des collisions pour une navigation robotique efficace

Une équipe de chercheurs propose, dans un préprint déposé sur arXiv le 2 mai 2026 (référence 2605.02192), un nouveau cadre d'entraînement pour la navigation robotique par apprentissage par renforcement profond (DRL), baptisé Multi-Collision reset Budget (MCB). La convention actuelle dans la majorité des frameworks DRL est la suivante : toute collision déclenche immédiatement un reset global de l'épisode et est comptabilisée comme un échec total de la tâche. MCB rompt avec cette logique en découplant la terminaison locale sur collision du reset global de l'environnement, permettant à l'agent d'effectuer plusieurs tentatives au sein d'un même épisode sur une configuration d'obstacles difficile, jusqu'à épuisement d'un budget de collisions défini. Les expériences ont été conduites sur plusieurs plateformes robotiques simulées et réelles, et les auteurs rapportent des gains de taux de succès et d'efficacité de navigation supérieurs aux baselines à collision unique, avec un budget de collisions réduit produisant les meilleurs résultats. L'enjeu est directement lié à une limite connue du DRL appliqué à la navigation en environnements denses : en pénalisant durement chaque collision dès les premières étapes d'entraînement, les agents évitent les configurations complexes plutôt que de les apprendre, ce qui ralentit la convergence. MCB autorise une exploration plus agressive des zones difficiles sans pour autant sacrifier la sécurité en déploiement, où la politique apprise conserve un comportement zéro-collision. Cela adresse indirectement le "sim-to-real gap" en exposant l'agent à des scénarios d'entassement d'obstacles que les resets prématurés rendaient statistiquement rares durant la phase d'exploration précoce. L'approche n'est toutefois présentée que dans un contexte de résultats expérimentaux préliminaires, sans benchmark comparatif exhaustif sur des datasets standardisés. Cette publication s'inscrit dans un débat plus large sur la conception des fonctions de récompense et des conditions de terminaison en DRL pour la navigation mobile, un domaine où des travaux comme ceux de Berkeley (sur la navigation sociale) ou les approches curriculum learning d'OpenAI ont montré l'importance des dynamiques d'exploration en début d'entraînement. Côté robotique industrielle, les AMR (Autonomous Mobile Robots) de Exotec ou des intégrateurs logistiques européens utilisent majoritairement des planificateurs classiques, mais la pression vers des politiques apprises pour des environnements non-structurés rend ce type de recherche pertinent à moyen terme. La prochaine étape logique serait une validation sur des plateformes de référence (TurtleBot, Spot, ou robots humanoïdes à roues) et une comparaison directe avec des méthodes curriculum existantes.

UEImpact indirect à moyen terme : si l'approche MCB se confirme sur des benchmarks standardisés, des acteurs comme Exotec ou des intégrateurs AMR européens opérant en environnements non-structurés pourraient en tirer parti pour passer à des politiques de navigation apprises.

RecherchePaper
1 source
Les robots transforment les transpalettes
33Robotics & Automation News 

Les robots transforment les transpalettes

Les chariots élévateurs à palette, longtemps cantonnés à un usage manuel dans les entrepôts, franchissent un cap technologique notable avec l'intégration massive de la robotique. Ces engins se muent progressivement en AGV (Automated Guided Vehicles) ou en AMR (Autonomous Mobile Robots), deux architectures distinctes : les AGV suivent des trajets prédéfinis via rails magnétiques ou marquages au sol, tandis que les AMR naviguent librement grâce à des capteurs LiDAR, des caméras stéréo et des algorithmes de cartographie SLAM. La fusion de ces technologies avec des couches d'intelligence artificielle permet aux chariots de détecter des obstacles, de replannifier leurs itinéraires en temps réel et de s'intégrer aux systèmes WMS (Warehouse Management System) existants. Pour un intégrateur ou un COO industriel, l'enjeu est direct : l'automatisation des tâches de manutention répétitives réduit les coûts opérationnels, augmente la cadence de traitement des palettes et limite les incidents liés à la fatigue humaine. Les AMR modernes atteignent des charges utiles de plusieurs tonnes et opèrent en multi-équipe sans interruption, ce qui modifie en profondeur les calculs de ROI sur les projets logistiques. Cela dit, l'article analysé relève davantage du contenu marketing généraliste que d'une annonce produit ou d'un déploiement chiffré, et n'apporte pas de métriques concrètes validant ces performances. Le marché de la manutention autonome est aujourd'hui dominé par des acteurs comme Linde, Toyota Industries, Jungheinrich ou Still côté chariots traditionnels reconvertis, face à des pure-players robotiques tels que Balyo, Exotec ou Fetch Robotics. En Europe, des acteurs français comme Exotec positionnent leurs solutions sur des segments adjacents (stockage automatisé dense), tandis que la pression des grands opérateurs e-commerce accélère les cycles d'adoption. Les prochaines étapes du secteur portent sur l'interopérabilité flotte et la standardisation des interfaces API entre AMR et WMS.

UEPlusieurs acteurs européens (Jungheinrich, Still, Linde, Balyo) et le français Exotec sont directement positionnés sur ce marché en consolidation, leur conférant un avantage structurel face aux pure-players américains et asiatiques.

IndustrielOpinion
1 source
Vers un MAPF réaliste : SMART, un banc de test multi-agents extensible pour le monde réel
34arXiv cs.RO 

Vers un MAPF réaliste : SMART, un banc de test multi-agents extensible pour le monde réel

Une équipe de chercheurs a publié SMART (Scalable Multi-Agent Realistic Testbed), un environnement de simulation open-source destiné à l'évaluation des algorithmes MAPF (Multi-Agent Path Finding), c'est-à-dire la planification de trajectoires sans collision pour des flottes de robots. Le papier, référencé arXiv:2503.04798, présente un outil capable de simuler jusqu'à plusieurs milliers de robots simultanément, en intégrant un moteur physique complet qui modélise la kinodynamique des robots et les incertitudes d'exécution réelles. SMART s'appuie sur un cadre de supervision d'exécution basé sur l'Action Dependency Graph (ADG), ce qui permet une intégration modulaire avec différents planificateurs MAPF et modèles de robots. Le code est disponible publiquement sur GitHub, accompagné d'un service de démonstration en ligne. L'enjeu industriel est direct : les meilleurs planificateurs MAPF actuels sont capables de calculer des trajectoires pour des centaines de robots en quelques secondes, mais ils reposent presque tous sur des modèles de robots simplifiés, ignorant la dynamique réelle, les glissements, les délais de démarrage ou les imprécisions de positionnement. Ce fossé entre simulation idéalisée et comportement terrain est un frein majeur au déploiement en entrepôt ou en atelier. SMART propose de combler ce gap en permettant aux intégrateurs et aux équipes R&D de tester leurs algorithmes dans des conditions proches de la réalité sans avoir besoin de dizaines ou de centaines de robots physiques, ressource quasi-inaccessible en laboratoire. Pour un COO industriel qui évalue des solutions AMR (Autonomous Mobile Robots), disposer d'un simulateur crédible et open-source réduit significativement le risque d'un déploiement raté. Le problème du sim-to-real gap dans le MAPF est documenté depuis plusieurs années, et des acteurs comme Amazon Robotics, Geek+ ou Exotec en Europe ont développé leurs propres outils internes. SMART vise à démocratiser cet accès, notamment pour les équipes académiques et les intégrateurs de taille intermédiaire. Le framework ADG n'est pas nouveau, il était déjà central dans les travaux antérieurs sur l'exécution robuste de MAPF, mais son intégration dans un simulateur à physique réaliste et passant à l'échelle représente une avancée méthodologique. Les prochaines étapes probables incluent la validation sur des cas industriels concrets et l'ajout de modèles de robots commerciaux comme les AMR à différentiel ou les AGV à guidage magnétique.

UEExotec, acteur français des AMR d'entrepôt, est cité parmi les rares industriels disposant d'outils internes similaires ; SMART pourrait réduire la barrière à l'entrée pour les équipes R&D et intégrateurs européens de taille intermédiaire souhaitant valider des algorithmes MAPF sans flotte physique.

RecherchePaper
1 source
Amélioration de la reconstruction de surfaces en verre par estimation de profondeur pour la navigation robotique
35arXiv cs.RO 

Amélioration de la reconstruction de surfaces en verre par estimation de profondeur pour la navigation robotique

Des chercheurs ont publié le 25 avril 2026 sur arXiv (arXiv:2604.18336) un framework de reconstruction de surfaces vitrées destiné à améliorer la navigation autonome en intérieur. Le problème visé est concret : les capteurs de profondeur (LiDAR, RGB-D) échouent systématiquement face aux surfaces transparentes ou réfléchissantes comme le verre, qui génèrent des mesures erronées ou absentes. L'approche proposée exploite Depth Anything 3, un modèle fondationnel de vision monoculaire, comme prior géométrique, puis aligne ce prior sur les données brutes du capteur via un algorithme RANSAC local. Ce mécanisme permet d'éviter que les mesures corrompues par le verre ne contaminent la reconstruction finale, tout en récupérant une échelle métrique absolue que le modèle de fondation seul ne fournit pas. L'équipe publie également GlassRecon, un dataset RGB-D inédit avec vérité terrain dérivée géométriquement pour les régions vitrées, et annonce la mise à disposition du code et des données sur GitHub. Ce travail adresse un angle mort réel de la navigation robotique en milieu tertiaire. Les bureaux, centres commerciaux, aéroports et hôpitaux sont truffés de cloisons vitrées, de vitrines et de portes transparentes qui font échouer les AMR (Autonomous Mobile Robots) commerciaux en production. Le fait que le framework soit training-free est un avantage pratique direct pour les intégrateurs : il ne nécessite pas de retrainer un modèle sur des données propriétaires, et peut s'insérer dans un pipeline de navigation existant sans modification majeure. Les expériences montrent des gains consistants par rapport aux baselines de l'état de l'art, particulièrement dans les cas de corruption sévère du capteur, ce qui suggère une robustesse utile en conditions réelles plutôt qu'en environnement de laboratoire contrôlé. La détection et la reconstruction de surfaces transparentes est un problème ouvert depuis plusieurs années dans la communauté robotique. Des travaux antérieurs comme GlassNet ou Trans10K avaient abordé la segmentation du verre en RGB pur, mais la fusion avec des données de profondeur restait peu explorée de manière training-free. Du côté concurrentiel, des approches de completion de profondeur par deep learning (IP-Basic, PENet) ou de slam robuste aux occultations existent, mais elles requièrent typiquement un entraînement spécialisé. La contribution de ce papier est de positionner les modèles de fondation non pas comme remplaçants du capteur, mais comme régularisateurs géométriques. Les prochaines étapes annoncées sont la publication du dataset GlassRecon et du code, ce qui permettra à la communauté d'évaluer la reproductibilité des résultats. Aucun déploiement terrain ni partenaire industriel n'est mentionné à ce stade : il s'agit d'une contribution de recherche, pas d'un produit.

RecherchePaper
1 source