Aller au contenu principal
Capteur cutané conforme pour la cartographie en temps réel de la forme
RecherchearXiv cs.RO7sem

Capteur cutané conforme pour la cartographie en temps réel de la forme

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont présenté sur arXiv (preprint 2605.01170, mai 2025) un capteur souple et conforme capable de reconstruire en temps réel la déformation tridimensionnelle d'une surface flexible, sans recourir à la vision. Le dispositif intègre un réseau 2D de jauges de contrainte imprimées à base d'indium-gallium eutectique oxydé (o-EGaIn), emboîtées en miroir dans un film élastomère. Un réseau de 5x5 capteurs espacés de 12 mm mesure les contraintes hors axe neutre, et un modèle d'observation informé par la mécanique des matériaux, couplé à une routine d'optimisation rapide, estime simultanément la courbure locale, l'élongation, le décalage et l'orientation. Le système atteint une erreur moyenne de reconstruction de surface de 0,62 mm avec une latence de 100 ms, testée sur des scénarios combinant étirement, flexion et indentation. Les démonstrations incluent le suivi de gestes de la paume, l'indentation par un doigt, et la déformation d'un ballon sous contact.

Ce résultat est notable parce qu'il adresse une limitation structurelle des approches visuelles existantes : la nécessité d'une ligne de visée et d'une instrumentation complexe, incompatibles avec les environnements occultés ou à espace contraint, notamment la chirurgie mini-invasive, les prothèses ou les doigts de préhension robotique. La précision sub-millimétrique à 10 Hz ouvre un espace d'utilisation pour le suivi épidermique du mouvement, l'interaction haptique à retour de forme, et la surveillance peropératoire en temps réel, sans nécessiter de marqueurs externes ni de caméras. Il s'agit cependant d'un preprint académique : aucun produit n'est annoncé ni commercialisé.

Les capteurs à base d'EGaIn liquide-métal sont étudiés depuis une décennie pour leur déformabilité et leur conductivité, mais la reconstruction 3D continue à partir de mesures de contraintes distribuées reste un problème ouvert. Les approches concurrentes incluent les capteurs à fibre optique (FBG), plus précis mais rigides et coûteux, et les peaux tactiles matricielles à base de matériaux piézorésistifs ou capacitifs. Ce travail se distingue par la combinaison d'une fabrication par impression, d'un modèle mécanique intégré et d'une latence compatible avec le contrôle en boucle fermée. Les prochaines étapes naturelles sont l'intégration sur un effecteur robotique souple ou un instrument chirurgical, et la tenue à l'autoclave pour la stérilisation.

Dans nos dossiers

À lire aussi

OREN : réseau résiduel octree pour la cartographie en distance euclidienne signée en temps réel
1arXiv cs.RO 

OREN : réseau résiduel octree pour la cartographie en distance euclidienne signée en temps réel

Des chercheurs ont publié sur arXiv (réf. 2510.18999, version 2) OREN, pour Octree Residual Network, une méthode de reconstruction de fonctions de distance signée euclidienne (ESDF) en temps réel à partir de nuages de points 3D. L'architecture est hybride : une structure octree assure l'interpolation spatiale explicite, tandis qu'un réseau de neurones calcule le résidu implicite. L'objectif annoncé est un ESDF complet (non tronqué), différentiable, avec une empreinte mémoire et computationnelle comparable aux méthodes volumétriques discrètes classiques, et une précision proche des approches entièrement neurales. Des expériences extensives sur des jeux de données de référence sont citées à l'appui de ces affirmations. La carte de distance signée est une primitive fondamentale de l'autonomie robotique : elle conditionne la planification de trajectoire, le contrôle d'évitement de collision et le SLAM. Les méthodes en production restent majoritairement des TSDF (Truncated Signed Distance Field, comme VoxBlox) rapides et scalables mais tronqués à une bande de surface étroite et non différentiables ; les méthodes neurales pures (iSDF de Meta, approches NeRF-based) sont continues et précises mais souffrent d'oubli catastrophique dans les grands environnements et restent trop coûteuses pour l'embarqué temps-réel. Si les performances annoncées de OREN résistent à une validation indépendante, l'approche pourrait concrètement débloquer l'ESDF temps-réel pour des robots mobiles et manipulateurs opérant à grande échelle en environnements dynamiques, sans les compromis habituels. OREN s'inscrit dans une vague de méthodes hybrides cherchant à réconcilier efficacité des structures discrètes et expressivité neurale, aux côtés de travaux comme SHINE-Mapping ou NGLOD. Les représentations volumétriques comme OctoMap et OpenVDB dominent encore les déploiements industriels réels. Meta avait positionné iSDF en 2022 comme alternative neurale scalable ; depuis, plusieurs équipes de recherche travaillent à réduire les coûts d'inférence pour franchir le seuil du temps-réel embarqué. L'article est un preprint arXiv (v2, soumis en octobre 2025), sans peer-review finalisé et sans affiliation industrielle identifiée dans le résumé. Les prochaines étapes attendues incluent une évaluation sur des benchmarks standardisés tels que ScanNet ou SemanticKITTI, et une intégration dans des pipelines SLAM open-source pour confirmer les gains annoncés en conditions réelles.

RecherchePaper
1 source
La puce 6 mW du MIT permet aux mini-drones de voir et cartographier leur environnement en temps réel
2Interesting Engineering 

La puce 6 mW du MIT permet aux mini-drones de voir et cartographier leur environnement en temps réel

Des chercheurs du MIT ont présenté à l'IEEE VLSI Symposium un système-sur-puce baptisé Gleanmer, capable de construire des cartes 3D détaillées de l'environnement en temps réel avec une consommation d'environ 6 milliwatts. La puce cible les plateformes à très faible autonomie énergétique : micro-drones, robots embarqués, et potentiellement casques de réalité augmentée légers. Ses applications directes incluent la navigation en milieux confinés, systèmes de ventilation industriels, entrepôts, tunnels, où l'évitement d'obstacles est critique et où embarquer un GPU classique est hors de question. L'équipe, conduite par Vivienne Sze (professeure de génie électrique et informatique au MIT) et les co-premiers auteurs Peter Zhi Xuan Li et Zih-Sing Fu, a couplé le silicium à un algorithme de cartographie maison nommé GMMap. Plutôt que de recourir aux représentations voxel classiques (des millions de petits cubes), GMMap modélise l'espace avec des ellipsoïdes gaussiens flexibles qui encodent les surfaces courbes et les espaces ouverts en consommant nettement moins de mémoire. L'algorithme traite chaque image de profondeur en un seul passage et peut fusionner les gaussiennes redondantes, celles générées quand le robot observe le même objet sous plusieurs angles, sans avoir à relire les données brutes. Résultat : seuls quelques pixels doivent résider en mémoire à tout instant, et la majeure partie des données actives tient dans la SRAM on-chip rapide, évitant les accès coûteux à une mémoire externe. Ce niveau de frugalité est significatif pour le secteur. Gleanmer consomme environ 2,5 % de l'énergie exigée par la meilleure puce de cartographie existante selon les benchmarks publiés par l'équipe, et réduit la consommation de la planification de trajectoire sans collision à environ 20 % de la référence habituelle. Pour les intégrateurs qui travaillent sur des plateformes à budget énergétique serré (nano-drones de 50 g, robots d'inspection en tube, wearables industriels), la différence entre 250 mW et 6 mW n'est pas marginale : elle conditionne la durée de mission et le dimensionnement de la batterie. La puce a également démontré sa capacité à reconstruire des obstacles et espaces libres en direct à partir du flux vidéo d'une caméra iPhone, ce qui ouvre une voie vers des prototypes rapides sans matériel dédié. Le MIT n'est pas seul sur ce terrain. Intel Labs, Qualcomm et plusieurs startups spécialisées en edge AI (Syntiant, Perceive) travaillent à réduire l'empreinte des pipelines de perception embarquée. Mais l'angle co-design algorithme-hardware du groupe de Vivienne Sze, déjà connu pour des travaux similaires sur les accélérateurs de réseaux de neurones, distingue Gleanmer d'une approche purement matérielle. Les chercheurs envisagent de rapprocher davantage les ressources de calcul des capteurs pour gagner encore en efficacité lors des prochaines itérations, et explorent si les représentations gaussiennes pourraient aussi accélérer le traitement de plans techniques et de schémas complexes, au-delà du seul domaine robotique. Aucun calendrier de commercialisation ni partenaire industriel n'ont été annoncés à ce stade.

RecherchePaper
1 source
Membrane proprioceptive hautement déformable pour la reconstruction de forme 3D en temps réel
3arXiv cs.RO 

Membrane proprioceptive hautement déformable pour la reconstruction de forme 3D en temps réel

Des chercheurs ont publié sur arXiv (identifiant 2601.13574, version 2) une membrane proprioceptive souple en silicone capable de reconstruire sa propre géométrie 3D en temps réel, sans caméra. La membrane, de format 140 mm x 140 mm, intègre des LED montées en bordure et des photodiodes réparties en son centre au sein d'un composite élastomère multicouche. Lorsque la membrane se déforme au contact d'un objet, les signaux d'intensité lumineuse captés par les photodiodes varient selon des motifs caractéristiques que décrypte un modèle entraîné par apprentissage automatique. Le système atteint un taux de mise à jour de 90 Hz en bout de chaîne, avec une erreur moyenne de reconstruction de 1,307 mm pour des déformations hors-plan allant jusqu'à 25 mm. Il tient également sur de grandes déformations dans le plan, jusqu'à 75 % d'allongement, avec une distance de Chamfer moyenne de 1,214 mm, métrique standard pour comparer deux nuages de points 3D. L'intérêt pour la robotique industrielle et les systèmes mous est direct : les approches vision (caméras RGB-D, stéréo) échouent sous faible éclairage ou en situation d'occlusion, conditions courantes en manipulation d'objets complexes, en logistique densément chargée ou en chirurgie assistée. Une membrane qui infère la forme d'une surface par contact contourne ces limitations sans exposer de composants optiques externes fragiles. L'architecture par guides d'onde optiques évite également les écueils des capteurs résistifs ou capacitifs (dérive thermique, sensibilité aux perturbations électromagnétiques) et des approches magnéto-sensitives (compatibilité limitée avec certains environnements industriels). À 90 Hz, la latence est compatible avec des boucles de contrôle en temps réel pour la préhension adaptative ou le suivi de surface en soudage ou collage. Ce travail s'inscrit dans un champ en pleine effervescence : les peaux tactiles pour robots, où les laboratoires de recherche (MIT CSAIL, Stanford HCI, ETH Zürich) et des entreprises comme GelSight (rachetée par Meta), Touchlab ou Xela Robotics cherchent à doter les effecteurs robotiques d'un sens du toucher fiable et scalable. L'approche par guide d'onde optique n'est pas nouvelle, le capteur GelSight repose sur un principe optique similaire pour la mesure de texture locale, mais son application à la reconstruction de forme globale sur membrane déformable à grande déformation (75 % de strain) constitue une avancée de portée. L'article ne mentionne pas de prototype industriel ni de partenariat de commercialisation ; il s'agit d'une publication académique, sans timeline de déploiement annoncée. Les prochaines étapes logiques incluent l'intégration sur des préhenseurs à doigts souples et la validation sur des géométries d'objets variées hors laboratoire.

RecherchePaper
1 source
Mono-Hydra++ : construction en temps réel de graphes de scènes monoculaires par apprentissage multi-tâches pour la cartographie 3D intérieure
4arXiv cs.RO 

Mono-Hydra++ : construction en temps réel de graphes de scènes monoculaires par apprentissage multi-tâches pour la cartographie 3D intérieure

Des chercheurs ont publié en mai 2026 (arXiv:2605.17661) Mono-Hydra++, un pipeline temps réel capable de construire des graphes de scène 3D hiérarchiques d'intérieurs en n'utilisant qu'une caméra RGB monoculaire et une IMU, sans capteur de profondeur actif. Le coeur du système repose sur M2H-MX, un modèle multi-tâches fondé sur DINOv3 qui estime simultanément la profondeur et la sémantique des images. Ces estimations alimentent un front-end d'odométrie visuelle-inertielle (VIO) enrichi de contraintes de profondeur prédites creuses, d'un masquage sémantique des zones dynamiques et d'un alignement temporel tenant compte de la pose, avant fusion volumétrique dans le backend Mono-Hydra. Sur le sous-ensemble d'évaluation Go-SLAM/ScanNet, le système affiche 1,6 % d'erreur de trajectoire en moins que le meilleur baseline RGB-D testé ; sur le benchmark calibré 7-Scenes, il réduit l'ATE moyen de 29,8 % par rapport au meilleur concurrent calibré. Le modèle de perception M2H-MX-L, exporté en ONNX/TensorRT FP16, tourne à 25,53 FPS sur un Jetson Orin NX 16 Go, et le pipeline a été validé dans un déploiement réel dans un bâtiment ITC avec une caméra RealSense RGB + IMU. L'impact industriel est direct pour les plateformes à contraintes sévères : drones d'inspection, robots humanoïdes légers et AMR embarquant peu de puissance. Jusqu'ici, la construction de graphes de scène 3D, qui organisent l'espace en objets, pièces et relations spatiales, nécessitait des capteurs actifs (RGB-D ou LiDAR) impraticables dès que le payload ou la consommation électrique sont limités. Mono-Hydra++ démontre qu'il est possible d'atteindre, voire de dépasser, la précision de ces baselines lourds avec une seule caméra et une IMU bas coût. Pour un intégrateur ou un COO industriel, cela signifie une réduction substantielle du coût matériel embarqué et l'ouverture de cas d'usage où le RGB-D n'est pas envisageable. Il convient toutefois de noter que les résultats sont issus de benchmarks académiques standardisés : la robustesse sur des scènes industrielles non contrôlées, avec éclairages difficiles ou textures répétitives, reste à confirmer dans des conditions opérationnelles réelles. Mono-Hydra++ s'inscrit dans la lignée du système Hydra du MIT, qui a posé les bases de la représentation hiérarchique en graphe de scène pour la robotique. L'utilisation de DINOv3 comme backbone de vision fondationnelle est cohérente avec la tendance forte à extraire simultanément géométrie et sémantique depuis des modèles pré-entraînés à grande échelle. Sur ce terrain, les concurrents directs incluent les systèmes basés sur RGB-D comme Go-SLAM, iMAP ou NICE-SLAM, ainsi que des approches VIO-sémantiques récentes, mais peu proposent la combinaison complète cartographie métrique, sémantique et graphe de scène en temps réel sur matériel embarqué contraint. En tant que preprint arXiv non encore évalué par les pairs, les prochaines étapes attendues sont la publication en conférence (IROS, ICRA), des tests sur plateformes aériennes effectives et une éventuelle intégration dans des stacks robotiques open-source comme ROS 2.

UELes constructeurs européens d'AMR légers et de drones d'inspection pourraient à terme réduire leurs coûts matériels embarqués en remplaçant les capteurs RGB-D par une caméra monoculaire, sous réserve de validation dans des conditions industrielles non contrôlées.

RecherchePaper
1 source