RechercheInteresting Engineering 7 juin 2026

Vidéo : un robot maîtrise l'air hockey et bat des humains sans jamais toucher une vraie table

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de trois étudiants de l'Université de la Colombie-Britannique (UBC) a développé une table de air hockey contrôlée par intelligence artificielle, capable d'affronter des joueurs humains sans avoir jamais été entraînée sur une vraie table. Le système repose sur un transfert simulation-réel (sim-to-real) : l'agent IA a été entraîné exclusivement dans un jumeau numérique haute-fidélité de la table, via une méthode d'apprentissage par renforcement appelée "soft actor-critic" (SAC), qui remplace les moteurs physiques classiques comme Unity ou Unreal pour accélérer les itérations sur des millions de parties simulées. Une fois le modèle entraîné, il a été transféré directement dans le robot physique, équipé d'une caméra aérienne à 120 images par seconde et d'un palet recouvert de bande rétroréfléchissante pour améliorer le tracking. Résultat : l'IA s'est montrée compétitive face à un adversaire humain dès le premier contact avec la table réelle, sans phase d'adaptation supplémentaire.

Ce qui rend ce résultat notable, c'est la gestion explicite du "reality gap", le fossé qui sépare habituellement les performances en simulation de celles dans le monde réel. Le air hockey est un cas particulièrement difficile : le palet se déplace à grande vitesse, ses rebonds sont chaotiques, et le système doit absorber des latences caméra, des fluctuations de tension, des vibrations mécaniques et un tracking imparfait. L'équipe a répondu à ce problème par ce qu'on appelle la "domain randomization" : plutôt que de simuler une table parfaite, ils ont introduit délibérément des imperfections, rails inégaux, rebonds inconsistants, chutes d'alimentation, latence variable, pour forcer l'agent à raisonner en termes de distributions de positions probables plutôt qu'en trajectoires exactes. C'est une approche qui contredit le réflexe habituel de "nettoyer" les simulateurs, et dont les résultats suggèrent que l'imperfection contrôlée peut être un levier d'apprentissage plus robuste que la précision physique maximale.

Sur le plan du contexte, ce projet étudiant s'inscrit dans un effort de recherche plus large sur les transferts sim-to-real pour les systèmes autonomes, thème central dans la robotique de manipulation, les drones et les véhicules autonomes. Il ne s'agit pas d'un produit commercialisé ni d'un déploiement industriel, mais d'une preuve de concept académique dont le code est disponible sur GitHub. Les laboratoires travaillant sur des agents de manipulation à grande échelle, comme Physical Intelligence (Pi) avec pi-0 ou des équipes universitaires spécialisées en sim-to-real, explorent des problèmes analogues sur des environnements bien plus complexes. Ce qui distingue ce travail, c'est la clarté méthodologique et la reproductibilité revendiquée : si l'approche tient à plus grande échelle, la domain randomization couplée au SAC pourrait réduire significativement les coûts et délais d'entraînement de robots autonomes dans des environnements industriels non structurés.

Dans nos dossiers

Physical Intelligence — π0

À lire aussi

1Interesting Engineering

Vidéo : un robot de la taille d'une main à 8 actionneurs intelligents marche, trotte et saute

Le Q8botOne est un robot quadrupède open-source de la taille d'une paume de main, conçu par Eric Wu et destiné aux hobbyistes, étudiants, chercheurs et développeurs. Contrairement à son prédécesseur Q8bot -- qui nécessitait un assemblage manuel -- le Q8botOne est livré entièrement monté et prêt à l'emploi dès la mise sous tension. Sa mobilité dynamique repose sur huit actionneurs intelligents DYNAMIXEL de la série XL, qui animent des pattes à liaison parallèle légères, fabriquées par impression 3D Multi Jet Fusion (MJF) et équipées de joints à roulements de précision. Ces pattes permettent au robot de marcher, de trotter et de sauter, des capacités habituellement réservées à des plateformes bien plus encombrantes et coûteuses. Le système de contrôle s'articule autour d'un microcontrôleur ESP32-C3-MINI-N4, alimenté par une batterie lithium-ion avec circuit de protection intégré. L'électronique est entièrement centralisée sur un PCB personnalisé, éliminant le câblage distribué caractéristique des projets DIY classiques. Le robot sera disponible prochainement via une campagne Crowd Supply, dont le prix n'a pas encore été communiqué. Ce qui distingue le Q8botOne dans le paysage de la robotique éducative est l'intégration verticale de sa conception : PCB central, actionneurs de série DYNAMIXEL -- habituellement réservés à des plateformes de recherche -- et châssis MJF constituent une combinaison rare à ce format. En supprimant la phase d'assemblage, le projet abaisse significativement le seuil d'entrée pour expérimenter la locomotion quadrupède, un domaine traditionnellement onéreux en temps et en matériel. L'interface UART supporte des coprocesseurs comme un Raspberry Pi avec une alimentation jusqu'à 5 V à 3 A, ouvrant la voie à des applications de vision par ordinateur, de navigation autonome ou d'IA embarquée. Un connecteur Qwiic facilite l'ajout de capteurs compatibles SparkFun et Adafruit sans câblage complexe. Ces choix d'architecture font du Q8botOne un banc d'essai crédible pour la recherche en locomotion et en contrôle, pas uniquement un gadget grand public. Le Q8botOne s'inscrit dans la lignée du Q8bot original, dont il reprend l'approche agile et low-cost tout en franchissant un cap vers la clé-en-main. Le secteur des petits quadrupèdes open-source est animé par des projets comme le Unitree Go1 Nano ou le SpotMicro, mais peu proposent une intégration PCB aussi poussée à ce gabarit. Sur le segment éducatif, le Q8botOne se positionne face aux kits Freenove ou aux dérivés MiniCheetah, avec l'avantage d'actionneurs DYNAMIXEL reconnus pour leur fiabilité dans les labos de recherche. Les fichiers mécaniques sont développés dans Onshape, garantissant l'accessibilité à l'écosystème open-source. La campagne Crowd Supply, dont la date de lancement reste à confirmer, sera le vrai test de la demande du marché pour une plateforme quadrupède aussi compacte et prête à l'emploi.

RecherchePaper

1 source

2arXiv cs.RO

Phantom : entraîner des robots sans robots, uniquement avec des vidéos humaines

Une équipe de chercheurs a publié Phantom (arXiv:2503.00779), un framework d'entraînement de politiques de manipulation robotique n'utilisant aucune donnée robot : uniquement des vidéos de démonstrations humaines. Le pipeline extrait les trajectoires via estimation de pose des mains (hand pose estimation), efface le bras humain par inpainting, puis superpose un rendu 3D du robot cible pour produire des paires observation-action directement exploitables. Déployé en zero-shot sur matériel réel sans fine-tuning, le système atteint jusqu'à 92 % de taux de réussite sur des tâches de manipulation d'objets déformables, de balayage multi-objets et d'insertion de composants. Les politiques supportent l'exécution en boucle fermée (closed-loop) et généralisent à des environnements inédits non vus à l'entraînement. L'enjeu est la scalabilité des données. La téléopération, méthode dominante chez Figure, 1X ou Physical Intelligence, exige du matériel disponible, des opérateurs qualifiés et des sessions d'enregistrement coûteuses. En substituant des vidéos humaines à ces démos, Phantom compresse drastiquement le coût d'acquisition du dataset. Si les taux de réussite annoncés se confirment en dehors des conditions contrôlées du laboratoire, cela représenterait un argument solide contre le "reality gap" classique entre simulation et déploiement industriel. La capacité à généraliser sans fine-tuning, point souvent problématique pour les modèles VLA (Visual Language Action), mérite toutefois une validation sur des environnements plus variés que ceux présentés dans le papier. Le problème des données hors-robot n'est pas nouveau : DexMV, ACT et les travaux autour de GR00T N2 de NVIDIA ont exploré des voies comparables, et Physical Intelligence avec pi-0 a parié sur la diversité massive de données multi-embodiment. Les approches sim-to-real via IsaacLab ou Genesis constituent les concurrents méthodologiques directs, contournant le même obstacle par la simulation plutôt que par la vidéo humaine. Phantom se distingue par sa légèreté : pas de flotte de robots nécessaire pour constituer le dataset initial. Le travail reste à ce stade une preuve de concept académique, sans partenariat ni déploiement industriel annoncé. La prochaine étape attendue serait une validation sur des morphologies robotiques variées et des tâches à précision sub-millimétrique.

RechercheOpinion

1 source

3arXiv cs.RO

Une couche d'interaction mécanique virtuelle permet des transferts d'objets humain-robot fiables

Des chercheurs ont publié sur arXiv (preprint 2511.19543v2) une approche visant à rendre les transferts d'objets entre humains et robots plus robustes face aux imprévus. Le coeur de la contribution est une couche d'interaction basée sur le Virtual Model Control (VMC), une technique de contrôle qui simule des ressorts et amortisseurs virtuels autour de l'effecteur pour absorber les variations dynamiques de pose de l'objet lors du passage de main. En complément, les auteurs intègrent la réalité augmentée (AR) pour établir une communication bidirectionnelle en temps réel entre l'opérateur humain et le robot, permettant à chaque partie d'anticiper l'intention de l'autre. Les performances du contrôleur ont été évaluées sur une série d'expériences couvrant différentes sources d'incertitude, puis validées par une étude utilisateur impliquant 16 participants testant plusieurs profils de contrôle et visualisations AR. La problématique du transfert d'objet humain-robot (H2R handover) est un verrou bien identifié en robotique collaborative : une légère désorientation de la pièce, un geste hésitant, et le robot échoue ou force l'objet, ce qui rend ce scénario incompatible avec un déploiement industriel fiable. L'approche VMC est intéressante parce qu'elle ne dépend pas d'une trajectoire rigide pré-planifiée mais s'adapte en continu, ce qui réduit la sensibilité au sim-to-real gap souvent fatal aux méthodes basées sur l'apprentissage. L'ajout de la boucle AR pour synchroniser les intentions est également prometteur pour les environnements d'assemblage où la communication verbale est difficile. L'étude utilisateur montre une préférence générale pour l'approche proposée, même si 16 participants reste un panel modeste pour généraliser les conclusions. Le problème H2R est un domaine actif depuis plusieurs années, avec des approches concurrentes allant du contrôle en impédance classique aux méthodes VLA (Vision-Language-Action) comme Pi-0 de Physical Intelligence ou les travaux sur GR00T N2 de NVIDIA. Le VMC s'inscrit dans la tradition du contrôle à base de modèle, plus explicable mais moins généraliste que les approches end-to-end. L'article est à ce stade un preprint sans affiliation industrielle identifiée ni déploiement annoncé, ce qui le place clairement dans la catégorie recherche fondamentale. Les prochaines étapes probables incluent une soumission en conférence (ICRA ou IROS) et des tests sur une plus large cohorte ou sur un robot commercial tel qu'un UR ou Franka.

RecherchePaper

1 source

4Interesting Engineering

Sixième sens : un robot navigue sans caméra grâce à une perception tactile semblable à celle de l'humain

Des chercheurs de la National University of Singapore (NUS) ont mis au point un système de proprioception pour robots souples, publié dans Nature Communications, qui permet à une machine de percevoir sa propre position et les forces externes sans recourir à des caméras ni à des systèmes de suivi externe. Le dispositif repose sur ce que l'équipe appelle un cadre d'"expected perception" : le robot calcule en continu la position attendue de son corps à partir de ses commandes motrices, puis compare cette prédiction aux données réelles de ses capteurs à métal liquide, capables de mesurer la flexion, la déformation et la contrainte mécanique. Tout écart entre prédiction et mesure est interprété comme un contact externe. Lors d'un test de navigation autonome dans un labyrinthe, le robot s'est déplacé uniquement par toucher, sans aucune entrée visuelle. Dans un second protocole, un opérateur humain lui a guidé des mouvements de type massage sur un mannequin médical ; le robot a ensuite reproduit ces trajectoires de manière autonome avec une haute fidélité. La professeure Cecilia Laschi, du département de génie mécanique de la NUS, précise que le système détecte un contact externe en moins de 0,4 seconde et identifie la direction de la force appliquée avec une marge d'erreur inférieure à 10 degrés, y compris dans des environnements dynamiques. Ce résultat s'attaque à un verrou fondamental de la robotique souple : jusqu'ici, les capteurs de déformation réagissaient indifféremment aux mouvements propres du robot et aux interactions extérieures, rendant impossible la distinction entre les deux. L'approche "expected perception" résout ce problème en mimant le mécanisme prédictif du cerveau humain, sans nécessiter de couche de vision coûteuse en calcul et fragile en conditions dégradées. Pour les intégrateurs industriels et les équipes R&D en robotique médicale, cela ouvre une voie crédible vers des manipulateurs souples déployables en salle d'opération, en rééducation ou dans les dispositifs d'assistance aux personnes âgées, où la sécurité au contact et la robustesse en environnement non structuré sont prioritaires. La navigation sans caméra présente également un intérêt direct pour la robotique sous-marine, secteur où la visibilité est souvent compromise. Cecilia Laschi est une figure centrale de la robotique souple mondiale, connue notamment pour ses travaux pionniers sur les bras inspirés des pieuvres au BioRobotics Institute de Scuola Superiore Sant'Anna (Italie) avant de rejoindre la NUS. La robotique souple reste dominée par des laboratoires académiques, avec peu de produits commerciaux matures, face à des acteurs comme Festo (Allemagne) sur les actionneurs pneumatiques ou Soft Robotics Inc. (USA) dans la préhension industrielle. L'étape suivante annoncée par l'équipe est l'intégration de modèles d'apprentissage automatique pour affiner les représentations internes du robot, s'inspirant de la façon dont le cerveau humain construit ses modèles sensori-moteurs par l'expérience, une direction qui converge avec les travaux actuels sur les VLA (Vision-Language-Action models) appliqués à la manipulation physique.

UEImpact indirect sur l'UE : Cecilia Laschi a construit sa réputation au BioRobotics Institute de Sant'Anna (Italie) et Festo (Allemagne) opère sur le segment des actionneurs souples industriels visé par cette avancée, mais la recherche est conduite à Singapour sans déploiement européen annoncé.

RecherchePaper

1 source