RechercheRobotics Business Review20h

Nous savons construire des robots plus intelligents, il reste à apprendre à mieux les tester

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Un robot humanoïde est aujourd'hui accessible à l'achat pour 14 000 dollars, sans certification de sécurité standardisée ni protocole de validation comportementale obligatoire. L'auteur de cet article, chercheur en robotique, a co-publié deux travaux récents qui convergent vers un même constat : les méthodologies de test n'évoluent pas au même rythme que les architectures de contrôle autonome. Pour cartographier ce décalage, il propose une taxonomie en cinq niveaux, classifiant les robots non pas selon le degré d'attention humaine (comme le fait la norme SAE pour les véhicules), mais selon le mode de traitement de l'information et de génération du comportement par la machine elle-même. Niveau 0 : téléopération pure. Niveau 1 : imitation par behavior cloning, fragile dès que les conditions terrain s'écartent légèrement des données d'entraînement. Niveau 2 : apprentissage supervisé en temps réel, où le robot détecte son incertitude, se met en pause et intègre une correction humaine via inverse reinforcement learning. Niveau 3 : apprentissage auto-supervisé, le robot générant ses propres signaux d'entraînement par essais-erreurs sans intervention humaine. Niveau 4 : reinforcement learning complet, le robot reformulant chaque tâche comme un problème d'optimisation résolu en interaction continue avec son environnement.

Ce que cette taxonomie révèle est structurellement important pour les intégrateurs et les décideurs industriels : chaque niveau supplémentaire introduit un type de défaillance fondamentalement différent, qui rend les approches de test existantes insuffisantes. Aux niveaux 0 et 1, les outils sont matures et les comportements testables de façon exhaustive. Dès le niveau 2, il faut valider non seulement le comportement mais aussi le mécanisme de détection d'incertitude et l'intégrité de chaque mise à jour d'apprentissage. Au niveau 3, le robot réécrit continuellement sa propre politique : tester une performance instantanée ne suffit plus, il faut auditer le processus d'apprentissage lui-même. Au niveau 4, l'espace comportemental est trop vaste et trop dynamique pour une énumération exhaustive des cas de test. La thèse centrale est que les garanties formelles de sécurité doivent remplacer l'énumération de cas tests aux niveaux élevés d'autonomie, et que l'évaluation de robustesse adversariale doit devenir aussi systématique que les tests fonctionnels.

Cette réflexion s'inscrit dans un moment charnière de l'industrie : les laboratoires et industriels (Figure, Boston Dynamics, Agility, 1X, Unitree côté hardware ; Physical Intelligence, DeepMind, NVIDIA côté fondations VLA) poussent vers une autonomie croissante, mais le cadre réglementaire reste absent pour les systèmes à prise de décision autonome en environnement non contrôlé. L'absence de standards équivalents aux normes ISO 10218 pour les robots industriels fixes crée un vide que comblent actuellement les constructeurs eux-mêmes, avec des métriques internes difficiles à auditer. Les prochaines étapes identifiées par l'auteur pointent vers l'intégration de méthodes de vérification formelle et de red-teaming adversarial comme pratiques standard de validation, avant que des déploiements à grande échelle dans des environnements non structurés ne rendent ces lacunes coûteuses.

Impact France/UE

Le vide réglementaire identifié, absence de normes équivalentes aux ISO 10218 pour les robots à décision autonome, concerne directement le marché européen, où l'AI Act devra s'appliquer à des systèmes dont les méthodes de validation restent aujourd'hui définies unilatéralement par les constructeurs.

Dans nos dossiers

Boston Dynamics Unitree Physical Intelligence — π0

À lire aussi

1Interesting Engineering

Les robots apprennent à se relever après des chutes dans les escaliers grâce à un système de stabilisation intelligent

Des chercheurs du ROAR Laboratory (Robotics and Automation Research) de l'Université de Technologie et de Design de Singapour (SUTD) ont publié une étude sur la mitigation des chutes de robots en escalier, présentant un système basé sur l'apprentissage par renforcement couplé à un bras mécanique à trois degrés de liberté (3 DOF). Le dispositif est monté à l'arrière d'une plateforme mobile à chenilles et intervient activement pendant la chute, au lieu de se limiter à la prévention. Entraîné entièrement en simulation sur cinq modes de chute répertoriés (chute arrière droite, pivotements latéraux, effondrements de côté), le contrôleur atteint un taux de succès moyen de 69,4 % pour stopper et stabiliser le robot, contre 38,6 % pour une méthode de contrôle codée à la main. Lorsqu'il réussit, le système stabilise la plateforme en 4,25 secondes en moyenne, bien en deçà du seuil interne fixé à 10 secondes. Testé sur des robots 10 % plus grands ou plus petits et sur des escaliers aux dimensions variables, le meilleur contrôleur atteint 87 % de succès sur une plateforme plus grande. Le résultat le plus significatif n'est pas le taux de succès en lui-même mais le changement de paradigme qu'il représente : le secteur s'est longtemps concentré sur la prévention des chutes via la planification de trajectoire et la détection d'obstacles, en présupposant que le risque résiduel était marginal. Une étude de terrain sur plusieurs années citée par l'équipe indique pourtant que les robots conçus pour les escaliers tombent au moins 35 fois plus souvent sur ce type de surface qu'en terrain plat. Le professeur Mohan Rajesh Elara, directeur du ROAR Lab, formule l'enjeu en termes d'adoption industrielle : tant que les opérateurs ne disposent pas d'une réponse crédible au risque résiduel, ces plateformes resteront perçues comme une source de responsabilité plutôt que comme un outil. Le fait que le contrôleur généralise à des géométries non vues pendant l'entraînement est également notable pour les intégrateurs : il suggère qu'un seul modèle pourrait couvrir une flotte hétérogène sans réentraînement par plateforme. Le système n'est pas prêt pour un déploiement commercial : les chercheurs reconnaissent explicitement qu'il ne satisfait pas la norme de sécurité fonctionnelle IEC 61508, qui impose des niveaux d'intégrité stricts pour les systèmes embarqués en environnement humain. Les prochaines étapes portent sur l'amélioration de la fiabilité, l'ajout de sécurités mécaniques redondantes et la validation expérimentale hors simulation. Dans le paysage concurrentiel, Boston Dynamics (Spot, Atlas), Agility Robotics (Digit) et les acteurs humanoïdes (Figure AI, 1X, Unitree) investissent massivement dans la stabilité dynamique, mais peu publient des données quantifiées sur la récupération post-chute. Ce travail de la SUTD se positionne davantage comme recherche fondamentale que comme annonce produit, mais il fournit une baseline méthodologique utile pour comparer les approches à venir.

UEAucun acteur européen impliqué, mais la référence explicite à la norme IEC 61508 (certification fonctionnelle européenne) positionne ce travail comme une étape préliminaire obligatoire avant tout déploiement commercial en UE de robots mobiles en environnement humain.

RecherchePaper

1 source

2Interesting Engineering

De nouveaux robots fourmis travaillent comme de vrais insectes pour construire et démonter de façon autonome

Des chercheurs de la Harvard John A. Paulson School of Engineering and Applied Sciences (SEAS) ont publié dans la revue PRX Life une étude décrivant une flotte de robots appelés "RAnts" (Robotic Ants), capables de construire et démanteler des structures de manière autonome, sans plan directeur ni contrôleur central. Ces agents physiques suivent un ensemble minimal de règles locales : détecter un gradient lumineux, transporter des blocs, et les déposer lorsqu'un seuil d'intensité est atteint. Pour remplacer les phéromones chimiques des fourmis biologiques, l'équipe du Professeur L. Mahadevan a introduit le concept de "photormones" : des champs lumineux qui jouent le même rôle de signal environnemental, permettant à chaque robot de modifier son environnement et de réagir aux modifications effectuées par ses congénères. Ce mécanisme s'appuie sur le principe biologique de stigmergie. Le basculement entre mode construction et mode démolition ne nécessite que l'ajustement de deux paramètres : l'intensité du comportement de suivi lumineux et le seuil de dépôt ou de ramassage des blocs. L'intérêt industriel de cette approche réside dans sa robustesse intrinsèque. Un système décentralisé n'a pas de point de défaillance unique : si un agent tombe en panne, le reste de l'essaim continue d'opérer. Pour les intégrateurs et les décideurs B2B, cela pose une alternative crédible aux architectures de coordination centralisées, souvent coûteuses à maintenir et fragiles en environnements non structurés. Le concept d'"exbodied intelligence" proposé par Mahadevan est théoriquement significatif : il déplace le centre de gravité de l'intelligence hors du hardware individuel, vers l'interaction continue entre les agents et leur environnement évolutif. Cela contredit directement la tendance dominante en IA, qui mise sur des modèles toujours plus grands et des processeurs toujours plus puissants. Ici, la complexité émergente est obtenue à coût computationnel minimal. Les résultats semblent solides sur le plan des principes, mais l'article ne précise pas les dimensions des robots, leur payload, leur vitesse de cycle, ni les volumes de blocs traités, ce qui limite pour l'instant l'évaluation de leur transposabilité industrielle réelle. La robotique en essaim n'est pas un domaine nouveau : des travaux pionniers comme le projet Kilobot au MIT ou les recherches de Marco Dorigo (Université Libre de Bruxelles) sur les algorithmes de colonie de fourmis ont posé les bases théoriques il y a plus d'une décennie. Ce qui distingue les RAnts est l'utilisation d'un support physique de communication (la lumière) plutôt que d'une infrastructure de communication numérique externe, ce qui simplifie le déploiement en environnements contraints. Les applications envisagées par l'équipe incluent la construction autonome en zones dangereuses, l'exploration planétaire, et la modélisation du comportement animal. Ces cas d'usage restent à ce stade prospectifs : aucun pilote industriel ni partenariat de déploiement n'est annoncé. La prochaine étape logique serait de démontrer la scalabilité du système avec des essaims de plusieurs dizaines d'unités dans des environnements 3D non contrôlés, condition nécessaire avant toute adoption par des acteurs comme les agences spatiales ou le secteur de la construction en milieux extrêmes.

UELes travaux de Marco Dorigo (ULB, Bruxelles) sur les algorithmes de colonie de fourmis constituent le socle théorique de ce domaine, mais cette étude Harvard n'implique pas directement d'acteurs européens ni de déploiement en Europe.

RecherchePaper

1 source

3arXiv cs.RO

Apprendre aux robots à dire « Je ne sais pas » : SENTINEL pour un SLAM conscient de l'incertitude

Une équipe de chercheurs présente SENTINEL, un cadre d'estimation de fiabilité pour LiDAR 2D bas coût, conçu pour prévenir les corruptions silencieuses dans les systèmes de SLAM (localisation et cartographie simultanées). Le principe central : calculer un score de fiabilité par scan, compris entre 0 et 1, en combinant des statistiques géométriques sur le nuage de points avec une cohérence de profondeur croisée entre le LiDAR et une caméra RGB-D. Lorsque ce score descend sous un seuil, les scans jugés corrompus sont rejetés et le robot bascule automatiquement vers une odométrie à roues calibrée. La méthode est entièrement sans entraînement et sans étiquettes. Les expériences ont été conduites sur un robot GEFIER R1 à quatre roues en configuration skid-steer, équipé d'un RPLidar A2M12 et d'une caméra Intel RealSense D435i, dans une arène de 185 cm sur 245 cm intégrant des obstacles à surfaces réfléchissantes et transparentes : verre, miroir, papier brillant, et combinaison miroir-papier brillant. L'enjeu est significatif pour quiconque déploie de la navigation autonome sur plateformes à budget contraint. Les LiDAR 2D entrée de gamme, massivement utilisés dans les robots éducatifs et les AMR industriels économiques, ne disposent pas du canal d'intensité que les capteurs haut de gamme exploitent pour diagnostiquer leurs propres défaillances. Les surfaces réfléchissantes ou transparentes, omniprésentes en environnement réel (vitrages, sols polis, rayonnages métalliques), provoquent des lectures fantômes ou des pertes de retour qui corrompent silencieusement la carte SLAM sans que le système le détecte. SENTINEL fournit un signal diagnostique là où le hardware n'en offre aucun, sans nécessiter de dataset ni de phase d'apprentissage, ce qui le rend déployable directement sur du matériel existant. Le problème posé par les matériaux réfléchissants est un angle mort structurel du SLAM basé simulation : ces conditions de surface sont quasi absentes des environnements synthétiques, ce qui rend la validation sur hardware réel indispensable, choix que les auteurs justifient explicitement. Dans le paysage plus large, la robustesse du SLAM face aux défaillances capteur est un domaine actif, avec des approches concurrentes comme les méthodes de détection d'outliers en ICP, ou les architectures LiDAR-inertial (LOAM, LIO-SAM) qui adressent partiellement le problème mais requièrent des capteurs plus riches. SENTINEL se positionne spécifiquement sur le segment bas coût, sans prétendre rivaliser avec ces stacks sur des plateformes dotées de LiDAR 3D. Les prochaines étapes naturelles seraient une intégration dans des stacks open-source comme Nav2 ou Cartographer, et une validation dans des environnements opérationnels plus larges.

UEAucun acteur français ou européen directement impliqué, mais les intégrateurs européens d'AMR économiques utilisant des LiDAR 2D bas coût (entrepôts, logistique légère) pourraient bénéficier de cette approche sans entraînement si elle est intégrée à Nav2 ou Cartographer.

RecherchePaper

1 source

4Interesting Engineering

Nouveau muscle artificiel intelligent pour un retour sensoriel humain dans les robots humanoïdes

Des chercheurs de l'Université nationale de Séoul (SNU) ont publié les résultats d'une étude portant sur un muscle artificiel intelligent capable de combiner actuation et perception dans une seule structure. Le dispositif repose sur des élastomères à cristaux liquides (LCE), un matériau polymère dont l'orientation moléculaire peut être contrôlée, dans lequel sont intégrés des canaux de métal liquide. L'architecture associe deux types de LCE en série : un LCE isotrope, qui joue le rôle de tendon, et un LCE nématique, qui se contracte comme un muscle sous l'effet d'un chauffage électrique. Deux canaux de métal liquide distincts assurent respectivement l'actuation et la mesure en temps réel de la force et de la déformation interne, sans capteur externe. L'équipe a démontré le système sur des doigts et pinces robotiques capables de saisir délicatement des objets tout en estimant automatiquement leur rigidité et leur taille. L'article ne communique pas de chiffres précis de force maximale ni de temps de cycle sur des missions répétées, ce qui limite la comparaison directe avec d'autres actionneurs publiés. Les chercheurs signalent par ailleurs deux limitations concrètes : une dérive de force liée à l'accumulation de chaleur lors de mouvements répétés, et des erreurs de suivi lors de changements brusques de consigne. L'intérêt industriel de ces travaux tient à la suppression de la séparation traditionnelle entre actuation et captation dans les muscles artificiels conventionnels, qui impose aujourd'hui des capteurs additionnels et des architectures de contrôle complexes. Un actionneur qui s'auto-surveille en temps réel réduit la masse embarquée et la surface d'intégration, deux contraintes critiques pour les membres de robots humanoïdes ou les dispositifs d'assistance médicale. Pour les intégrateurs et les équipes R&D travaillant sur des robots à manipulation douce, la capacité à estimer la compliance d'un objet sans outillage sensoriel dédié représente un gain de conception notable. Cela dit, les travaux en sont au stade de la démonstration de laboratoire : les performances sur tâches industrielles répétitives, le vieillissement thermique du matériau et la scalabilité de fabrication restent à établir avant toute application commerciale sérieuse. Cette publication s'inscrit dans un effort plus large de la communauté robotique pour combler le fossé entre actionneurs biologiques et mécaniques. En parallèle, des équipes du MIT Media Lab et du Politecnico di Bari travaillent sur des muscles à fibres électrofluides visant la même combinaison de force, vitesse et contrôle. Du côté industriel, les développeurs de robots humanoïdes comme Figure, Agility Robotics ou 1X s'appuient encore majoritairement sur des actionneurs électromécaniques rigides ou des câbles tendus, dont la gestion de contact reste un problème ouvert. Les LCE chauffés souffrent d'une lenteur de réponse inhérente, que les chercheurs de SNU proposent de corriger via des canaux de refroidissement intégrés ou des modules à effet Peltier, deux pistes qui alourdissent à nouveau le système. Les prochaines étapes annoncées comprennent le raffinement du modèle d'estimation d'élongation et l'étude de la distribution thermique dans le matériau, sans timeline précise de transfert vers un prototype industriel.

RecherchePaper

1 source