Aller au contenu principal
Génération de designs de robots diversifiés et fonctionnels par paramétrisation superquadrique et diversité-qualité
RecherchearXiv cs.RO3h

Génération de designs de robots diversifiés et fonctionnels par paramétrisation superquadrique et diversité-qualité

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de recherche propose, dans un preprint déposé sur arXiv (arXiv:2606.11037), une méthode de conception générative de robots combinant une représentation par superquadrics (SQs) avec l'algorithme de quality-diversity MAP-Elites. Les superquadrics sont des formulations mathématiques compactes et interprétables de formes géométriques 3D, paramétrables pour s'adapter à différents espaces de design. Les chercheurs les comparent aux CPPN (Compositional Pattern Producing Networks) comme générateurs de morphologies, en les couplant à des algorithmes évolutionnaires (EAs) classiques et à MAP-Elites. Sur deux environnements de test distincts, la combinaison SQs avec MAP-Elites atteint le score QD (quality-diversity) le plus élevé dans les deux cas, maximisant simultanément la diversité des formes générées et la performance fonctionnelle des robots obtenus.

Le résultat adresse un verrou récurrent en co-évolution morphologie/contrôle : la convergence prématurée des EAs vers un petit ensemble de designs sous-optimaux. Dans un contexte où la robotique physique diversifiée gagne du terrain, notamment pour des tâches industrielles hétérogènes, la capacité à explorer automatiquement de larges espaces de configurations morphologiques sans intervention humaine est un enjeu concret pour les équipes R&D. La compacité des SQs réduit la dimensionnalité du problème d'optimisation, tandis que MAP-Elites maintient une archive explicite de solutions qualitativement différentes, évitant l'effondrement de la diversité populationnelle. Les résultats suggèrent qu'une représentation géométrique interprétable est plus efficace qu'une représentation neuronale implicite (CPPN) quand on cherche à explorer un espace de design morphologique complexe.

MAP-Elites est une méthode QD développée initialement par Mouret et Clune (2015), largement utilisée en évolution de morphologies et en robotique adaptative. Les CPPN, introduits par Stanley et collaborateurs dans les années 2000, restent une référence concurrente pour l'encodage indirect de morphologies. Ce travail s'inscrit dans une tradition académique active autour du design automatisé de robots, qui inclut des équipes comme le lab Cheney/Clune (Vermont/Wyoming) ou le groupe Mouret à l'INRIA Paris. Il s'agit à ce stade d'un preprint sans validation par les pairs, avec des évaluations limitées à deux environnements simulés, sans validation hardware ni transfert sim-to-real rapporté. La prochaine étape naturelle serait une validation sur robot physique.

Impact France/UE

La méthode s'appuie sur MAP-Elites, algorithme développé par Mouret au sein de l'INRIA Paris, confirmant l'expertise française en évolution de morphologies robotiques, sans transfert industriel immédiat.

Dans nos dossiers

À lire aussi

Optimisation paramétrique co-conception de mains dextériques par approche fonctionnelle
1arXiv cs.RO 

Optimisation paramétrique co-conception de mains dextériques par approche fonctionnelle

Une équipe de chercheurs a publié fin avril 2025 sur arXiv (arXiv:2504.27557) un cadre paramétrique unifié pour la co-optimisation de mains robotiques dextères. L'approche couvre simultanément la structure de la paume, la cinématique des doigts, la géométrie des bouts de doigts et les courbures de surface à fine échelle, l'ensemble étant intégré dans un espace de conception unique. Les caractéristiques géométriques fines sont introduites via des noyaux de déformation de surface paramétriques qui agissent directement sur les interactions de contact. Le framework génère des modèles prêts pour la simulation et pour la fabrication physique, et sera publié en open-source. Les auteurs l'ont validé sur des tâches d'optimisation de la stabilité de préhension en simulation et dans des scénarios dynamiques réels, sans toutefois préciser les configurations exactes de tests ni le nombre de cycles d'évaluation dans le preprint. L'intérêt principal pour les équipes de R&D en robotique est de sortir du paradigme dominant où la conception mécanique de la main et la politique de contrôle sont développées en silos. En co-optimisant la morphologie et le comportement de préhension dans un même espace de paramètres, le framework permet d'explorer systématiquement des compromis que les approches découplées ratent structurellement, notamment l'influence directe de la courbure de surface sur la qualité du contact. L'ouverture en open-source vise à accélérer l'itération rapide pour les intégrateurs et les laboratoires travaillant sur le transfert sim-to-real et l'entraînement de politiques cross-embodiment, un problème central pour les VLA (Vision-Language-Action models) déployés sur des morphologies variées. La co-conception robotique (co-design) est un champ en plein essor, notamment depuis les travaux de MIT et Stanford sur les robots morphologiquement adaptatifs et les approches de differentiable simulation. Ce preprint s'inscrit dans une tendance plus large visant à rendre la conception mécanique différentiable et optimisable par gradient, aux côtés d'acteurs comme Dexterous Robotics, Shadow Robot ou les équipes internes de Figure AI et 1X Technologies qui développent leurs propres mains multi-doigts. Aucun partenariat industriel ni timeline de déploiement n'est mentionné ; il s'agit à ce stade d'une contribution académique avec promesse d'open-source, dont la valeur pratique dépendra de la qualité de l'outillage livré avec le code.

RecherchePaper
1 source
Planification robotique et gestion de situations par perception active
2arXiv cs.RO 

Planification robotique et gestion de situations par perception active

Des chercheurs présentent dans un preprint arXiv (réf. 2604.26988, mai 2026) un cadre logiciel baptisé VAP-TAMP, pour Vision-language model-based Active Perception for Task And Motion Planning, conçu pour doter les robots d'une capacité de détection et de gestion des situations imprévues en cours d'exécution de tâches. Le système cible des perturbations concrètes : une porte coincée, un objet tombé au sol, une modification de l'environnement due à une activité humaine. VAP-TAMP exploite une base de connaissances sur les actions du robot pour formuler dynamiquement des requêtes vers des modèles vision-langage (VLA/VLM), sélectionner activement des points de vue pertinents, puis évaluer la situation. En parallèle, il construit et interroge des graphes de scène pour assurer la planification intégrée des tâches et des mouvements. Le framework a été évalué sur des tâches de service en simulation et sur une plateforme réelle de manipulation mobile. L'enjeu est structurant pour toute démarche d'autonomie longue durée en robotique de service ou industrielle. L'un des verrous majeurs identifiés par les intégrateurs et les équipes R&D n'est pas la planification initiale, les planificateurs TAMP existants s'en sortent bien, mais la résilience à l'exécution : un robot qui échoue silencieusement ou se bloque face à un impondérable n'est pas déployable en production. VAP-TAMP propose une réponse architecturale à ce point de friction en couplant perception active (choix du meilleur angle de vue pour comprendre la situation) et raisonnement symbolique via graphes de scène, deux approches généralement traitées séparément. Si les résultats se confirment sur des scénarios plus variés, cela allège significativement la charge d'ingénierie pour les équipes qui construisent des pipelines de manipulation autonome. Le travail s'inscrit dans une dynamique de recherche intense autour de l'intégration VLM-TAMP, un champ qui a explosé depuis 2023 avec les travaux de Google DeepMind sur SayCan, de Physical Intelligence (Pi-0) et des équipes de Carnegie Mellon sur la planification par LLM. VAP-TAMP se positionne sur le maillon "récupération d'erreur" plutôt que sur la génération de plan initiale, ce qui le différencie d'approches comme Code-as-Policies ou Inner Monologue. Le preprint ne mentionne pas de partenariat industriel ni de calendrier de transfert technologique : il s'agit à ce stade d'une contribution académique, sans déploiement annoncé. Les prochaines étapes naturelles seraient une validation sur un spectre plus large de perturbations et une comparaison quantitative avec des baselines de récupération existantes.

RecherchePaper
1 source
Symétrie dynamique extrême : vers des robots omnidirectionnels et multifonctionnels
3arXiv cs.RO 

Symétrie dynamique extrême : vers des robots omnidirectionnels et multifonctionnels

Des chercheurs ont publié sur arXiv (référence 2605.29254) une étude introduisant le concept de "symétrie dynamique" appliqué à la conception de robots, en proposant une métrique formelle baptisée "isotropie dynamique". Cette mesure quantifie l'uniformité des accélérations atteignables par le centre de masse d'un robot dans toutes les directions. L'équipe a évalué ce principe sur plus de 1 000 morphologies simulées et construit un prototype physique de la famille Argus, un robot sphérique à 20 pattes doté d'actionneurs linéaires orientés radialement. Ce variant physique a démontré une locomotion invariante à l'orientation, une traversée agile de terrains encombrés et déformables, une auto-stabilisation rapide, et une tolérance aux pannes partielles d'actionneurs. La perception omnidirectionnelle distribuée permet en outre l'interaction avec des objets en mouvement continu. Cette approche représente un changement de paradigme notable dans la conception de robots mobiles. Jusqu'ici, la symétrie en robotique se limitait essentiellement à la forme géométrique (bipèdes, quadrupèdes, hexapodes). Ici, elle est exploitée au niveau de la capacité d'actuation dynamique, ce qui produit des gains mesurables en suivi de trajectoire, taux de succès aux tâches, robustesse aux perturbations et efficacité énergétique, avec des bénéfices qui s'accentuent à mesure que l'isotropie dynamique approche sa limite théorique. Pour les intégrateurs industriels et les concepteurs de systèmes autonomes, cela ouvre une voie générale vers des robots multitâches opérant en environnements non structurés, sans reconfiguration matérielle. Le travail s'inscrit dans une tendance plus large de la recherche sur les morphologies non-conventionnelles, aux côtés de robots sphériques et à symétrie sphérique explorés depuis plusieurs années en contexte d'exploration planétaire. Côté compétitif, les architectures bimorphes dominantes (Boston Dynamics Spot, Unitree B2, bipèdes humanoïdes de Figure ou 1X) optimisent l'efficacité pour des tâches spécifiques mais peinent en cas de basculement ou de panne partielle. Le robot Argus 20-pattes offre une résilience structurelle supérieure, au prix d'une complexité mécanique élevée. L'article reste pour l'instant un preprint académique sans annonce de commercialisation ni pilote industriel identifié, et les performances présentées s'appuient sur des vidéos sélectionnées et des simulations, ce qui invite à la prudence avant toute extrapolation à des déploiements réels.

RecherchePaper
1 source
Génération itérative et compositionnelle de données pour le contrôle de robots
4arXiv cs.RO 

Génération itérative et compositionnelle de données pour le contrôle de robots

Une équipe de chercheurs propose, dans un article arXiv (2512.10891, cinquième révision), un modèle génératif appelé "semantic compositional diffusion transformer" pour produire des données d'entraînement en manipulation robotique. Le principe central consiste à décomposer chaque transition dans l'espace d'état en quatre composantes distinctes, propres au robot, aux objets manipulés, aux obstacles, et à l'objectif de la tâche, dont les interactions sont apprises via des mécanismes d'attention. Entraîné sur un sous-ensemble limité de combinaisons de tâches, le modèle génère en inférence zéro-shot des transitions synthétiques de haute qualité pour des configurations jamais vues : nouveaux objets, nouveaux environnements, nouvelles associations robot-tâche. Un processus d'auto-amélioration itératif complète l'approche : les données synthétiques générées sont validées par apprentissage par renforcement hors-ligne (offline RL), puis réintégrées dans les rounds d'entraînement suivants. Au terme de ce cycle, le système résout la quasi-totalité des tâches de test non vues lors de l'entraînement. L'enjeu industriel est direct : collecter des démonstrations robotiques réelles pour couvrir l'espace combinatoire de toutes les tâches possibles en environnement multi-objets, multi-robots, multi-sites est économiquement prohibitif. Ce travail démontre qu'une structure compositionnelle apprise permet de briser cette malédiction combinatoire, sans démonstrations exhaustives. La boucle génération-validation-réentraînement est particulièrement notable : elle réduit le risque classique de drift sim-to-real en filtrant les transitions synthétiques non viables avant qu'elles ne contaminent le pipeline de policy learning. Les résultats surpassent significativement les baselines monolithiques et les approches compositionnelles à règles fixes (hard-coded), ce qui suggère que la structure compositionnelle émergente est réellement capturée par les représentations apprises, et non artificiellement injectée. Ce travail s'inscrit dans une dynamique de recherche qui cherche à contourner le goulot d'étranglement des données en robotique, aux côtés d'approches comme Diffusion Policy (Chi et al., CMU) ou les Visual Language Action models (VLA) tels que Pi-0 (Physical Intelligence) et GR00T N2 (NVIDIA). Là où ces derniers misent sur des fondations visuolinguistiques massives, cette contribution cible la généralisation compositionnelle avec des données d'entraînement réduites. La première soumission datant de décembre 2025 et le papier en étant à sa cinquième révision, les auteurs ont visiblement consolidé leurs expériences au fil des retours communautaires. Les prochaines étapes naturelles seraient une validation sur hardware réel et une extension aux chaînes de manipulation longue-horizon, domaine où l'absence de compositionnalité reste le principal point de rupture des approches actuelles.

RecherchePaper
1 source