Planificateurs de préhension 2D et 3D pour la…

Planification de mouvements pour la locomotion dynamique par préhension en microgravité

36

1arXiv cs.RO

Planification de mouvements pour la locomotion dynamique par préhension en microgravité

Des chercheurs ont publié sur arXiv (référence 2605.21704, mai 2026) une étude portant sur la conception de mouvements locomoteurs pour robots multi-membres en microgravité, dans des environnements où les points d'ancrage sont rares et disposés de façon irrégulière. L'approche étudiée repose sur la locomotion par saisie : le robot se déplace en agrippant successivement des ancrages fixes, plutôt qu'en marchant sur un sol stable. Les paramètres de conception analysés incluent le patron de démarche, la longueur de foulée, la vitesse de locomotion et la posture nominale du corps. Un cadre de planification paramétrable a été proposé pour évaluer ces variables en termes de stabilité et de demande en actuation. Deux morphologies quadrupèdes distinctes ont été testées en simulation physique. L'ensemble reste pour l'instant à l'étape de simulation, sans validation sur hardware réel. L'intérêt de cette recherche tient à la difficulté fondamentale de la locomotion hors-gravité : sans réaction au sol, les stratégies classiques de marche sont inopérantes, et le robot doit gérer simultanément des contraintes dynamiques et cinématiques couplées, incluant une manipulation en 6 degrés de liberté pour établir chaque contact. Les résultats indiquent que deux leviers améliorent significativement les performances : élargir l'espace de "contact wrench" faisable, c'est-à-dire maximiser la diversité des forces et couples transmissibles via les points d'appui, et atténuer les dynamiques impulsives de l'ensemble du corps, en évitant les mouvements brusques générateurs d'instabilité. Ces conclusions orientent directement le choix des configurations de contact et les stratégies de coordination corporelle pour de futurs systèmes réels. Ce travail s'inscrit dans un champ en expansion rapide : la robotique spatiale pour maintenance de satellites, exploration d'astéroïdes et interventions sur structures orbitales comme l'ISS. Des acteurs comme le DLR (Centre aérospatial allemand), le JPL-NASA avec ses robots grimpeurs, ou encore l'ESA avec ses programmes de robotique on-orbit, travaillent sur des problématiques adjacentes. La manipulation par saisie en microgravité intéresse aussi des projets d'exploration planétaire à faible gravité (Phobos, petits corps). La prochaine étape logique pour ce type de recherche est la validation expérimentale sur banc de test à gravité réduite ou en orbite, étape que l'étude ne couvre pas encore.

UELe DLR et l'ESA travaillent sur des problématiques adjacentes de robotique on-orbit ; cette recherche peut indirectement alimenter les programmes européens de maintenance satellitaire et d'exploration spatiale.

RecherchePaper

1 source

Structure de prédiction latente 4D pour la planification robotique

35

2arXiv cs.RO

Structure de prédiction latente 4D pour la planification robotique

Structured 4D Latent Predictive Model : un système de prédiction spatiale en 3D pour la planification robotique Une équipe de recherche publie sur arXiv (identifiant 2607.01166v1) un nouveau modèle baptisé « Structured 4D Latent Predictive Model », conçu pour la planification de tâches robotiques. Contrairement aux modèles prédictifs vidéo classiques, qui travaillent sur des séquences 2D, ce système prédit l'évolution de la structure 3D d'une scène dans un espace latent structuré, à partir d'observations visuelles et d'instructions textuelles. Cette représentation peut être décodée vers plusieurs formats 3D, offrant une compréhension plus complète et géométriquement cohérente de la scène. Le modèle sert de planificateur : il génère des scènes futures qui sont ensuite converties en actions exécutables par un module de dynamique inverse conditionné par l'objectif. Selon les auteurs, les expériences montrent une qualité visuelle élevée et une cohérence 3D et multi-vues nettement supérieure aux meilleurs planificateurs vidéo existants, avec de meilleures performances sur des tâches de manipulation complexes, une bonne généralisation à des conditions visuelles inédites, et une validation sur plateformes robotiques réelles. Un site dédié (structured-4d-model.github.io) présente le projet. L'enjeu dépasse la seule prouesse technique. Les modèles vidéo 2D dominent actuellement l'approche « world model » en robotique, notamment dans les architectures VLA (vision-language-action) qui inspirent des systèmes comme Pi-0 ou GR00T N2. Or ces approches peinent souvent à garantir une cohérence physique et spatiale suffisante pour une manipulation fine. En injectant explicitement une structure 3D dans l'espace latent, ce travail répond directement à une limite identifiée du secteur : le fossé entre démonstrations vidéo impressionnantes et exécution fiable sur du matériel réel, un problème central pour les intégrateurs industriels qui cherchent des systèmes robustes plutôt que des démonstrations sélectionnées. Il s'agit toutefois d'une publication académique à ce stade, sans laboratoire ni entreprise identifiés dans le résumé, et sans date de déploiement annoncée. Elle s'inscrit dans une compétition de recherche intense autour des modèles prédictifs pour la robotique, où plusieurs équipes explorent en parallèle des représentations 3D ou 4D pour dépasser les limites du tout-vidéo. Les prochaines étapes dépendront de la publication du code et de tests indépendants sur des plateformes tierces.

RecherchePaper

1 source

LDHP : planification hiérarchique pilotée par bibliothèque pour la manipulation dextérique non préhensile

38

3arXiv cs.RO

LDHP : planification hiérarchique pilotée par bibliothèque pour la manipulation dextérique non préhensile

LDHP, pour Library-Driven Hierarchical Planning, est un nouveau planificateur pour la manipulation non-préhensile, c'est-à-dire la manutention d'objets fins, larges ou difficiles à saisir avec une prise ferme classique (tissus, plaques, pièces plates). L'architecture proposée fonctionne en deux niveaux : un planificateur de haut niveau, dit "contact-state", propose des trajectoires de pose d'objet via des primitives appelées MoveObject, tandis qu'un planificateur de bas niveau génère des séquences de prise réalisables grâce à des primitives AdjustGrasp. La faisabilité de chaque mouvement est certifiée par des vérifications de collision et des calculs de mécanique quasi-statique, et les segments les plus sensibles au contact sont affinés par une méthode de dichotomie bornée. Les auteurs ont testé leur système sur robot réel, sur deux tâches : le levage d'objets sans mobilité (zero-mobility lifting) et l'insertion dans une fente (slot insertion), avec une exécution jugée cohérente et une robustesse démontrée face aux changements de forme et d'environnement. L'intérêt de ce travail tient à sa position par rapport aux deux grandes familles d'approches existantes. D'un côté, les planificateurs classiques ignorent souvent les contraintes réelles du gripper et produisent des mouvements théoriquement valides mais physiquement inexécutables sur un robot réel, un écueil fréquent derrière les démonstrations qui échouent hors labo. De l'autre, les approches par apprentissage, dont les modèles VLA à la GR00T N2, Pi-0 ou Helix, nécessitent d'immenses volumes de données et peinent à généraliser à des tâches hors distribution. En faisant de l'exécutabilité un critère de conception dès le départ, plutôt qu'une contrainte ajoutée après coup, LDHP découple le mouvement de l'objet de la faisabilité de la prise, ce qui permet à la même pipeline de transférer d'une tâche à l'autre et d'une géométrie d'objet à l'autre sans redéveloppement. Pour les intégrateurs et ingénieurs en robotique industrielle, c'est un signal que des pipelines structurées et certifiables peuvent rivaliser avec les approches data-hungry sur des tâches de manipulation fine, sans les coûts de collecte de données associés. La manipulation non-préhensile reste un problème de recherche ouvert de longue date, distinct du paradigme pick-and-place qui domine encore la robotique industrielle. Le champ s'est historiquement divisé entre méthodes de planification et de recherche formelles d'un côté, et méthodes d'apprentissage entraînées sur de larges jeux de démonstrations de l'autre. LDHP se positionne comme un pont entre les deux : une pipeline de planification structurée et vérifiable, mais conçue pour exposer des points d'accroche permettant d'y greffer, en option, des a priori appris. Publié sur arXiv en version mise à jour (v2), le travail reste à ce stade purement académique, sans produit ni déploiement industriel associé ; les suites logiques concerneraient l'extension à des tâches et des géométries d'objets plus complexes, ainsi qu'une intégration effective de composants appris dans les crochets prévus à cet effet.

RecherchePaper

1 source

GeneralVLA-2 : reconstruction géométrique et mémoire structurée pour la planification robotique

38

4arXiv cs.RO

GeneralVLA-2 : reconstruction géométrique et mémoire structurée pour la planification robotique

Une équipe de recherche affiliée au groupe AIGeeks a publié le 17 juin 2026 sur arXiv (2506.17480) GeneralVLA-2, une version améliorée de son système généraliste vision-langage-action (VLA) pour la planification de trajectoires robotiques. L'architecture de base, GeneralVLA, convertit des instructions en langage naturel et des observations RGB-D en chemins 3D pour l'effecteur terminal d'un robot. GeneralVLA-2 apporte deux contributions distinctes: GeoFuse-MV3D, une branche de reconstruction 3D multi-vues guidée par des a priori géométriques, qui remplace la reconstruction monoculaire SAM3D sujette aux hallucinations de pose; et une refonte du KnowledgeBank en système de mémoire à long terme avec métadonnées explicites de qualité, confiance, cycle de vie et détection de conflits. Sur le benchmark GSO-30, GeoFuse-MV3D réduit la Chamfer Distance de 2,20 % et le LPIPS de 2,02 % par rapport à la baseline MV-SAM3D, tout en améliorant PSNR et SSIM de respectivement 2,36 % et 1,03 %. Le KnowledgeBank gouverné gagne 4,53 points sur Terminal-Bench SR et 3,73 points sur SWE-Bench Verified par rapport à ReasoningBank, tout en réduisant les erreurs d'assertion (AS) de 4,95 % et 5,65 %. Ces améliorations s'attaquent à deux verrous concrets du pipeline VLA industriel: la qualité des représentations 3D d'objets en manipulation, et la fiabilité de la mémoire épisodique pour la réutilisation d'expériences. La reconstruction 3D monoculaire reste un point de défaillance majeur dans les déploiements réels, car une pose hallucinée en amont se propage directement en erreur de préhension. L'approche multi-vues avec fusion géométrique ciblée (visual-hull, raffinement axial, préservation de l'apparence) adresse ce problème de façon plus contrôlée. Les gains restent cependant modestes sur les métriques reportées, et il convient de noter qu'il s'agit d'un preprint sans peer review, avec des évaluations sur benchmarks laboratoire sans validation sur robot physique dans des conditions industrielles. GeneralVLA-1 avait posé l'interface hiérarchique langage-to-trajectory comme abstraction centrale pour les systèmes généralistes; cette version 2 consolide les fondations plutôt que d'étendre le périmètre. Dans l'espace VLA, les travaux concurrents incluent Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA), et OpenVLA (Berkeley), qui ciblent eux aussi le sim-to-real et la généralisation multi-tâche. La publication du code sur GitHub suggère une démarche de recherche ouverte, sans annonce de déploiement industriel ni partenariat opérationnel associé. Les prochaines étapes naturelles seraient une validation sur robot réel et des benchmarks de manipulation comparables à ceux de RoboMimic ou LIBERO.

RechercheOpinion

1 source

Planificateurs de préhension 2D et 3D pour la pince asymétrique GET

À lire aussi

Planification de mouvements pour la locomotion dynamique par préhension en microgravité

Structure de prédiction latente 4D pour la planification robotique

LDHP : planification hiérarchique pilotée par bibliothèque pour la manipulation dextérique non préhensile

GeneralVLA-2 : reconstruction géométrique et mémoire structurée pour la planification robotique