IA physiqueInteresting Engineering 16 juin 2026

Vidéo : un robot DIY fixé au plafond ramasse jouets, vêtements et objets épars

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Nathaniel Nifong, un ingénieur indépendant, a publié les plans complets d'un robot domestique open source baptisé Stringman, conçu pour ramasser et trier automatiquement les objets épars au sol. Le système repose sur une architecture à câbles (cable-driven parallel robot) : quatre lignes haute résistance, ancrées aux quatre coins d'une pièce, suspendent un préhenseur à deux doigts équipé d'un mécanisme de poignet, qui se déplace dans l'espace aérien de la pièce et descend environ 50 centimètres sous son point d'accroche pour atteindre le sol, voire sous les meubles. Le robot s'appuie sur la plateforme LeRobot de Hugging Face et apprend par imitation : l'utilisateur pilote le système en télé-opération pour lui enseigner la saisie de différents types d'objets. Des marqueurs fiduciaires clip-on désignent les zones de dépôt (bac à jouets, panier à linge, poubelle). L'ensemble est disponible sous licence Apache 2.0 sur GitHub, et des kits prêts à assembler sont proposés en parallèle pour ceux qui ne souhaitent pas usiner les pièces eux-mêmes.

L'intérêt principal de Stringman réside dans son rapport fonctionnalité/coût : avec seulement quatre moteurs, le système atteint une couverture spatiale qu'un bras robotique fixe ne peut pas égaler, sans les contraintes d'une plateforme mobile (batteries, navigation, coût unitaire). C'est la thèse centrale que défend Nifong : de nombreuses tâches domestiques répétitives peuvent être automatisées sans recourir aux robots humanoïdes, dont le coût et la complexité mécanique restent prohibitifs pour le grand public. L'architecture câble-driven évite rails, roues et membres articulés, tout en couvrant la totalité d'une pièce. Des algorithmes de compensation de balancement actif (swing-cancellation) stabilisent le préhenseur en déplacement, un défi classique des systèmes CDPR. Le projet inclut également un mode entièrement local pour le traitement vidéo et la télémétrie, répondant aux préoccupations de vie privée que soulèvent systématiquement les robots domestiques connectés.

Stringman s'inscrit dans l'écosystème DIY qui s'est constitué autour de LeRobot depuis son lancement par Hugging Face en 2024, un framework qui a déjà fédéré des centaines de contributeurs autour de manipulateurs de table bas coût comme le SO-100 ou le Koch v1.1. Il se positionne dans un segment distinct : l'espace domestique vertical plutôt que l'établi ou l'atelier. Il n'existe pas encore de concurrent direct sur ce format résidentiel, bien que les grues CDPR soient bien documentées dans la littérature de robotique industrielle. Les limites actuelles sont réelles et assumées par le créateur : la vision machine nécessite encore des ajustements, les objets plats comme les livres restent difficiles à saisir de manière fiable, et les câbles descendent dans la pièce pendant le fonctionnement, ce qui peut gêner les habitants. Un kit commercial est en préparation, mais ni date de disponibilité ni prix n'ont été communiqués.

Impact France/UE

Stringman s'appuie sur LeRobot de HuggingFace (entreprise française) comme plateforme d'apprentissage par imitation, renforçant l'adoption internationale de cet écosystème open source français comme standard émergent pour la robotique domestique apprenante.

À lire aussi

1IEEE Spectrum Robotics

Vidéo du vendredi : qui gagne entre un robot et un joueur professionnel de ping-pong ?

La semaine du 18 avril 2026 a été marquée par plusieurs démonstrations robotiques notables, dont la plus emblématique s'est déroulée à Pékin : lors d'un semi-marathon de 21 kilomètres réunissant 12 000 coureurs humains, plus de 100 robots humanoïdes ont pris le départ aux côtés d'athlètes humains, et trois d'entre eux ont franchi la ligne d'arrivée avant tout concurrent humain. Ce résultat, relayé par Al Jazeera, illustre une progression rapide de la locomotion bipedale en conditions réelles. En parallèle, Sony AI publiait dans Nature les résultats d'un système autonome capable de disputer une partie de ping-pong contre des joueurs professionnels, en relevant le défi de la perception haute vitesse et du contrôle dynamique en temps réel, deux verrous longtemps considérés comme bloquants pour l'IA physique compétitive. Autre fait marquant, le robot AthenaZero du Robotics and AI Institute a réalisé du jonglage à trois balles à mains nues, sans motion capture externe ni entonnoir mécanique, en s'appuyant uniquement sur des capteurs embarqués et une coordination oeil-main apprise pour gérer l'incertitude au contact. Ces résultats alimentent le débat sur l'écart entre démonstration et déploiement réel. Le semi-marathon de Pékin constitue une preuve de robustesse locomotrice en environnement non contrôlé, même si les conditions de course (surface, pace, assistance technique en bord de piste) mériteraient d'être précisées pour évaluer la comparabilité exacte avec une performance humaine. La publication Sony dans Nature donne une légitimité scientifique au domaine de l'IA physique compétitive et valide l'idée que des boucles de contrôle rapide peuvent être apprises à partir de données réelles plutôt que simulées. AthenaZero, de son côté, illustre les progrès du sim-to-real sur des tâches de manipulation dynamique sans infrastructure externe, ce qui ouvre la voie à des applications industrielles de tri ou de reorientation d'objets en mouvement. En contrepoint, IEEE Spectrum souligne que la vraie valeur en entrepôt vient encore de systèmes d'automatisation mobile comme ceux de Berkshire Grey, et non des humanoïdes, une nuance importante pour les décideurs B2B qui évaluent des ROI à court terme. Le contexte de cette semaine s'inscrit dans une accélération visible de la robotique chinoise, portée notamment par des acteurs comme Unitree, qui présente des séquences de locomotion en milieu non structuré, et DEEP Robotics, dont les robots quadrupèdes sont déjà déployés en patrouille résidentielle en Amérique du Nord. Sur le plan matériau, le Max Planck Institute for Intelligent Systems a publié une méthode d'évaluation des actionneurs électrostatiques souples utilisant des actionneurs Peano-HASEL, atteignant un rendement électromécanique de 63,6 %, soit plus de trois fois supérieur aux valeurs antérieurement rapportées, ce qui ouvre des perspectives pour des robots légers et silencieux. Côté mobilité aérienne, Skydio a montré la capture de drones en vol avec un bras UR20, tandis qu'ETH Zurich continue ses travaux sur drones suractuatés. Enfin, Sphero se positionne pour combler le vide laissé par LEGO Mindstorms sur le marché de la robotique éducative, un segment commercial non négligeable laissé en friche depuis l'abandon de la gamme par LEGO.

UELes publications de l'ETH Zurich sur les drones suractuatés et du Max Planck Institute sur les actionneurs Peano-HASEL (rendement 63,6%) positionnent la recherche européenne comme contributrice active dans l'écosystème mondial de la robotique physique légère.

IA physiquePaper

1 source

2Interesting Engineering

Vidéo : le nouveau modèle omni d'Unitree permet aux robots humanoïdes de penser, se déplacer et assister les humains

Unitree, le fabricant chinois de robotique connu pour ses robots quadrupèdes et humanoïdes low-cost, a dévoilé UnifoLM-OminiA-0.3, un modèle d'IA unifié destiné à ses robots humanoïdes. Ce système combine dans une seule architecture la perception omni-modale, le raisonnement, le dialogue et la manipulation mobile du corps entier, sans passer par des modules séparés pour la reconnaissance vocale, la détection d'objets, la navigation et la manipulation. Dans les vidéos de démonstration diffusées par Unitree, un robot humanoïde saisit un coussin et le pose sur un canapé, identifie des couleurs, compte des boîtes de médicaments, va chercher un médicament précis sur une étagère, trie du linge dans un panier, charge une assiette dans un lave-vaisselle et ajuste un lit médicalisé de type hospitalier. Une séquence montre le robot interrompre immédiatement l'ajustement du lit lorsqu'un utilisateur lui demande d'arrêter en pleine tâche, illustrant une réactivité dynamique aux instructions. L'annonce intervient peu après qu'Unitree a présenté un robot humanoïde à buste haut vendu à partir de 26 900 yuans, soit environ 4 290 dollars, positionné comme une alternative bon marché sur le marché. Sur le fond, l'intérêt revendiqué par Unitree n'est pas la nouveauté de chaque tâche individuelle, déjà démontrées séparément par d'autres constructeurs humanoïdes, mais la coordination de l'ensemble du flux (compréhension du langage, perception visuelle, décision, navigation, contrôle moteur) par un seul modèle plutôt qu'une chaîne de sous-systèmes. C'est la promesse centrale des architectures vision-langage-action (VLA) que le secteur cherche à valider à grande échelle: remplacer des routines programmées tâche par tâche par une généralisation across environnements, un enjeu jugé crucial pour les usages domestiques, hospitaliers et de soin où les objets bougent et les consignes changent en temps réel. Reste que ces démonstrations proviennent de vidéos sélectionnées par le fabricant, sans données chiffrées sur le taux de réussite, le temps de cycle, la charge utile ou le nombre de degrés de liberté, ni validation indépendante en conditions réelles de déploiement, ce qui invite à distinguer nettement la démonstration marketing du produit réellement livré ou déployé chez un client. UnifoLM-OminiA-0.3 s'inscrit dans le programme d'IA incarnée UnifoLM d'Unitree, qui a débuté en 2025 avec UnifoLM-WMA-0, un cadre open-source de modélisation du monde et de l'action destiné à prédire les effets physiques des interactions robot-environnement. Ce socle a été suivi début 2026 par UnifoLM-VLA-0, un modèle vision-langage-action, avant cette version omni-modale axée sur l'assistance à domicile et les soins. Unitree ne précise pas de calendrier de déploiement pilote ni de partenaires hospitaliers ou domestiques identifiés, la trajectoire du programme suggérant toutefois une progression méthodique vers des systèmes de plus en plus généralistes plutôt qu'un produit fini prêt à l'emploi.

IA physiqueActu

1 source

3Interesting Engineering

Vidéo : le cerveau robotique de Genesis permet une manipulation au niveau humain et un entraînement à grande échelle

Genesis AI a présenté GENE-26.5, un modèle de fondation robotique conçu pour doter les robots de capacités de manipulation au niveau humain. La vidéo de démonstration publiée par l'entreprise montre des robots accomplissant une séquence culinaire de 20 étapes (couper des tomates, casser un oeuf d'une seule main, coordonner les deux bras pendant la cuisson), ainsi que la préparation d'un smoothie avec service en l'air, des tâches de laboratoire (pipettage, transfert de liquides), du câblage pour assemblage électronique, la résolution d'un Rubik's Cube en manipulation aérienne continue, et l'interprétation d'une pièce de piano rapide. Pour alimenter l'entraînement du modèle, l'entreprise a développé un gant haptique équipé d'une peau électronique à capteurs tactiles, établissant une correspondance 1:1:1 entre la main humaine, le gant et la main robotique. Genesis revendique un coût matériel cent fois inférieur aux solutions de télé-opération conventionnelles, et une efficacité de collecte de données cinq fois supérieure. Le moteur de données associé intègre également des vidéos égocentriques issues de caméras portables et des vidéos publiques centrées sur l'activité humaine. Ces résultats, s'ils se confirment en environnement réel non contrôlé, représentent une avancée potentiellement significative sur l'un des verrous les plus tenaces de la robotique : l'écart d'incarnation (embodiment gap) entre les mains humaines et robotiques, qui limite depuis des années la transférabilité des données d'entraînement. La cartographie 1:1 glove-to-robot est une approche déjà explorée par des acteurs comme Physical Intelligence (pi-0) et plusieurs laboratoires académiques, mais Genesis revendique une démonstration à une échelle et une polyvalence inédites. Pour les intégrateurs industriels et les décideurs cherchant à automatiser des tâches non structurées (assemblage fin, préparation culinaire en volume, logistique d'entrepôt), la promesse d'un système généraliste capable d'apprendre directement des gestes humains quotidiens, sans retraining extensif, représenterait un changement de paradigme. Il faut toutefois noter que les démonstrations sont des vidéos éditées, sans données indépendantes sur le taux d'échec, les conditions d'éclairage, ou la reproductibilité en cycle de production continu. Genesis AI s'inscrit dans un segment en forte concurrence avec Physical Intelligence (pi-0, Berkeley), Figure AI (Figure 03, déployé avec BMW), Tesla (Optimus Gen 3), NVIDIA (GR00T N2) et Apptronik (Apollo). L'approche par gant haptique à bas coût rappelle les travaux d'Enchanted Tools, acteur français du service robotique, qui mise également sur la capture de mouvement humain pour réduire le coût d'entraînement. Genesis n'a pas encore annoncé de déploiements industriels confirmés ni de partenariats nominatifs : GENE-26.5 reste à ce stade une annonce de produit accompagnée d'une démonstration vidéo, pas un système disponible commercialement. L'entreprise indique prévoir le déploiement de ses gants en milieu de travail réel via des partenariats industriels, avec pour objectif de constituer une bibliothèque de compétences humaines à grande échelle pour l'entraînement robotique.

IA physiqueActu

1 source

4Interesting Engineering

Vidéo : un nouveau modèle d'IA permet aux robots humanoïdes de réussir 90 % des missions complexes

Flexion Robotics a dévoilé Reflect v1.0, une plateforme d'intelligence robotique destinée aux humanoïdes, capable d'exécuter des missions longues et multi-étapes sans intervention humaine pendant l'exécution. Pour illustrer les capacités du système, la société a présenté une démonstration en environnement de bureau : un robot humanoïde reçoit une instruction en langage naturel, récupère un colis de snacks livré au bâtiment, emprunte escaliers et ascenseur, déballe le carton à l'aide d'outils, puis range les articles dans un tiroir désigné. Selon Flexion, l'intégration du reinforcement learning sur plusieurs couches du système a fait passer le taux de complétion end-to-end d'une mission interne à 16 étapes de 38 % à 90 %, contre un modèle supervisé seul. La plateforme gère des charges comprises entre 100 grammes et 3,5 kilogrammes, et le robot est capable de repositionner un colis via des mouvements coordonnés du corps entier, d'opérer un ascenseur, de traverser des escaliers répétés et de contourner des obstacles dynamiques tout en portant des objets. Ce résultat est significatif parce qu'il s'attaque directement au problème de l'autonomie longue durée, considéré comme l'un des verrous majeurs de la robotique humanoïde commerciale. Dans une séquence de tâches, l'accumulation d'erreurs de navigation, de manipulation ou de perception finit statistiquement par faire échouer le système : c'est le "long-horizon failure mode" que les industriels connaissent bien. Reflect v1.0 le traite via un modèle vision-langage (VLM) personnalisé qui fait office de contrôleur de mission, surveille en continu l'avancement, raisonne sur l'environnement et re-planifie à la demande. La couche de mouvement combine des vision-language-action models (VLA) entraînés sur données réelles et des primitives issues du reinforcement learning, tandis qu'un contrôleur corps-entier temps réel assure équilibre et précision des gestes. Pour un COO industriel ou un intégrateur, le signal concret est le suivant : on passe de 38 % à 90 % de succès sur une mission à 16 étapes grâce au RL seul, ce qui suggère que le sim-to-real gap et la fiabilité multi-tâche sont partiellement solubles sans refonte matérielle. Flexion Robotics est une startup relativement récente dans l'écosystème humanoïde, qui se positionne comme fournisseur de couche logicielle agnostique au hardware, à l'image de ce que Apptronik ou 1X cherchent à faire sur leurs propres plateformes. L'article mentionne également ShengShu Technology et son modèle Motubrain, un "cerveau général" combinant perception, raisonnement et action, qui vise le même marché. La concurrence directe inclut Figure (Helix), Physical Intelligence (pi0), Boston Dynamics (Atlas Gen 2) et Tesla (Optimus Gen 3), tous engagés dans une course à l'autonomie longue horizon. Flexion reconnaît que Reflect v1.0 reste limité à des environnements définis, ce qui tempère le chiffre de 90 % : il s'agit d'une évaluation interne sur mission contrôlée, pas d'un déploiement industriel validé en conditions réelles. Les prochaines étapes annoncées concernent l'extension à des environnements moins structurés et la capacité à recevoir des instructions modifiées en cours de mission, deux marqueurs qui, s'ils sont confirmés en production, rapprocheraient Reflect d'une utilisabilité opérationnelle sérieuse.

IA physiqueOpinion

1 source