Aller au contenu principal
Héritage lamarckien en environnements dynamiques : comment les variables clés influencent la dynamique évolutive
RecherchearXiv cs.RO2j

Héritage lamarckien en environnements dynamiques : comment les variables clés influencent la dynamique évolutive

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs en robotique évolutionnaire a publié en mai 2025 sur arXiv (2605.15769) une étude clarifiant les conditions dans lesquelles l'héritage lamarckien améliore ou dégrade les performances d'un système de co-optimisation corps-cerveau. L'expérience repose sur des robots mous virtuels dont la morphologie évolue par algorithme évolutionnaire, tandis que le contrôleur est optimisé en cours de vie par apprentissage, soit par optimisation bayésienne, soit par apprentissage par renforcement. L'héritage lamarckien consiste ici à transférer directement les paramètres de contrôle appris par un parent à sa descendance, à la différence de l'héritage darwinien classique qui ne transmet que le génome structurel. Les auteurs font varier deux dimensions de l'environnement dynamique : le niveau de conflit entre les changements environnementaux et le comportement optimal du robot, et la prévisibilité de ces changements pour l'agent. Résultat : l'héritage lamarckien n'est inférieur à l'approche darwinienne que dans le seul cas où les changements sont à la fois conflictuels et imprévisibles. L'ajout d'un capteur permettant de détecter les transitions environnementales restaure les bénéfices lamarckiens même dans les environnements conflictuels, en donnant à l'agent les moyens d'anticiper un changement de comportement nécessaire.

Ce résultat réconcilie une littérature jusque-là contradictoire. La théorie évolutionnaire classique considère l'héritage lamarckien comme neutre ou négatif à long terme, tandis que plusieurs travaux récents en robotique évolutionnaire rapportaient des gains de performance. Cette étude suggère que les comparaisons précédentes omettaient de contrôler conjointement la conflictualité et la prévisibilité des perturbations, deux variables qui interagissent de façon non-linéaire. Pour les praticiens du morpho-evolution, domaine qui cherche à co-optimiser forme et contrôle pour des robots adaptatifs industriels ou de terrain, cela pose un cadre d'analyse actionnable : le bon mécanisme d'héritage dépend du profil statistique de l'environnement opérationnel, pas d'un choix dogmatique.

La co-optimisation morphologie-contrôleur est un problème ouvert depuis les travaux fondateurs de Karl Sims dans les années 1990, et reste un défi majeur en conception de robots autonomes. La robotique douce (soft robotics) sert ici de banc d'essai car ses espaces morphologiques continus amplifient la sensibilité aux stratégies d'héritage. Ce preprint n'est pas encore évalué par les pairs et les résultats reposent exclusivement sur simulation, le transfert sim-to-real reste à démontrer. Parmi les acteurs qui travaillent sur des approches similaires figurent des laboratoires comme le Vermont Complex Systems Center ou le groupe Kriegman, ainsi que des initiatives industrielles en conception générative de robots. La prochaine étape naturelle est une validation sur morphologies physiques dans des environnements dont les statistiques sont connues et contrôlées.

Dans nos dossiers

À lire aussi

Saisie mobile avec conscience de la visibilité en environnements dynamiques
1arXiv cs.RO 

Saisie mobile avec conscience de la visibilité en environnements dynamiques

Des chercheurs ont publié sur arXiv (arXiv:2605.02487) un système de préhension mobile baptisé « visibility-aware mobile grasping », conçu pour des robots à manipulateur opérant dans des environnements inconnus et dynamiques. L'architecture repose sur deux composants couplés : un planificateur bas niveau en corps entier (whole-body planner) associé à une perception active sensible à la vitesse, et un planificateur haut niveau hiérarchique fondé sur des arbres de comportement (behavior trees) qui génère des sous-objectifs adaptatifs. Les expériences ont été conduites sur 400 scénarios de simulation randomisés ainsi qu'en déploiement réel sur un robot mobile manipulateur Fetch. Le système atteint un taux de succès de 68,8 % dans des environnements statiques inconnus et de 58,0 % dans des environnements dynamiques, soit respectivement +22,8 et +18,0 points de pourcentage par rapport à l'approche de référence NAM (Non-prehensile Assisted Manipulation), avec une réduction mesurée des collisions. Le problème central que ce travail cherche à résoudre est un compromis fondamental en robotique mobile : un robot disposant d'un champ de vision limité doit arbitrer en permanence entre explorer pour réduire l'incertitude environnementale et progresser vers sa cible de saisie dans un espace de configuration à haute dimensionnalité. Les approches précédentes découpaient ces deux objectifs, ce qui rendait impossible la garantie de sécurité lorsque des obstacles dynamiques non observés intersectaient la trajectoire pendant la manipulation. En couplant la perception active à la planification de mouvement, et non en les traitant en séquence, les auteurs montrent qu'il est possible de maintenir une garantie de sécurité sans sacrifier les performances de saisie, un résultat pertinent pour les intégrateurs de systèmes pick-and-place en environnement non contrôlé. Ce travail s'inscrit dans un courant de recherche en pleine accélération autour des robots mobiles manipulateurs capables d'opérer hors de cellules balisées. Le Fetch, plateforme de recherche standard de Fetch Robotics (racheté par Zebra Technologies), est un choix délibérément accessible pour la reproductibilité. Les concurrents directs sur ce segment incluent les travaux de Mobile ALOHA (Stanford), de Spot Arm (Boston Dynamics) et de Hello Robot Stretch, ainsi que les systèmes AMR-à-bras d'Universal Robots et de Kassow Robots en Europe. La prochaine étape naturelle identifiée implicitement par les auteurs est l'extension à des scénarios avec plusieurs objets dynamiques simultanés et des environnements encore moins structurés, un écart entre performances en simulation et déploiement réel qui reste à confirmer sur des cycles industriels prolongés.

RecherchePaper
1 source
Comment fonctionnent réellement les VLA en environnements ouverts
2arXiv cs.RO 

Comment fonctionnent réellement les VLA en environnements ouverts

Un article de recherche publié sur arXiv (référence 2604.21192) soumet les modèles vision-langage-action (VLA) à une évaluation critique sur le benchmark BEHAVIOR1K (B1K), un protocole simulant des tâches domestiques complexes de longue durée dans des environnements ouverts. Le constat est net : les métriques standards de ces benchmarks, taux de succès ou score partiel, ne mesurent que l'état final des objets manipulés, indépendamment des événements qui y ont conduit. Un robot qui renverse un verre avant de le replacer peut ainsi obtenir le même score qu'un robot qui l'a manipulé sans incident. Ce protocole dit "progress-agnostic" ignore entièrement les comportements dangereux en cours d'exécution. Les chercheurs ont soumis plusieurs VLA de pointe à une analyse multidimensionnelle couvrant robustesse, reproductibilité, violations de sécurité et causes d'échec des tâches. Les implications sont directes pour tout acteur envisageant un déploiement réel. Si les métriques actuelles gonflent artificiellement les performances rapportées, les décisions d'intégration basées sur ces benchmarks reposent sur des bases fragiles. La distinction est capitale entre un modèle qui complète une tâche et un modèle qui la complète de façon sûre et reproductible, deux propriétés que les scores agrégés actuels confondent. Les auteurs proposent de nouveaux protocoles d'évaluation capables de capturer les violations de sécurité, comblant un angle mort majeur de la recherche. Pour un intégrateur ou un décideur industriel, cela signifie que les chiffres de "success rate" publiés par les laboratoires doivent être lus avec prudence, en exigeant explicitement des données de reproductibilité et des métriques comportementales. La course aux VLA s'est accélérée depuis 2024 avec des modèles comme pi0 de Physical Intelligence, GR00T N2 de NVIDIA, ou OpenVLA issu de Stanford et Berkeley. Ces systèmes combinent une fondation vision-langage avec un module d'action, affichant des capacités de généralisation notables en simulation. Ce papier suggère que le fossé simulation-réel est peut-être plus profond qu'estimé : des modèles performants sur B1K pourraient s'avérer moins fiables dès lors qu'on intègre sécurité et consistance comportementale comme critères d'évaluation. Les auteurs appellent la communauté à adopter ces nouveaux protocoles dans les futures éditions du B1K Challenge pour aligner les standards de recherche avec les exigences concrètes du déploiement en environnement ouvert.

RechercheOpinion
1 source
Les limites de l'évolution lamarckienne face à la pression de nouveauté morphologique
3arXiv cs.RO 

Les limites de l'évolution lamarckienne face à la pression de nouveauté morphologique

Une étude publiée sur arXiv (arXiv:2604.15854) en avril 2026 examine les limites de l'héritage lamarckien dans les systèmes de robots modulaires évolutifs. Le cadre expérimental repose sur une population de robots capables de co-évoluer leur morphologie et leurs contrôleurs, puis d'apprendre individuellement une tâche de locomotion. Dans un système lamarckien, les contrôleurs appris par les parents sont transmis directement aux descendants, contrairement à l'approche darwinienne classique où seule l'information génétique est héritée. Les chercheurs ont comparé les deux paradigmes en faisant varier la pression de sélection : d'une optimisation pure sur la performance de locomotion à une optimisation multi-objectif intégrant également une récompense pour la nouveauté morphologique. Résultat : l'héritage lamarckien surpasse le darwinisme en optimisation de tâche seule, mais accuse une chute de performance significativement plus importante dès que la diversité morphologique est encouragée. Ce résultat met en évidence un arbitrage fondamental dans la conception des systèmes d'évolution robotique : l'exploitation par héritage et l'exploration par diversité sont partiellement incompatibles. L'efficacité de l'héritage lamarckien repose sur une hypothèse implicite de continuité morphologique entre parent et descendant. Or, maximiser la diversité des formes casse précisément cette continuité, rendant les contrôleurs hérités peu ou pas transférables. Pour les chercheurs en robotique évolutive et les équipes travaillant sur la synthèse automatique de robots (notamment pour des applications d'adaptation en environnements non structurés), cela signifie que le choix du mécanisme d'héritage doit être conditionné au régime d'exploration morphologique visé. Ces travaux s'inscrivent dans un débat actif en robotique évolutive sur le sim-to-real gap et la capacité des algorithmes évolutifs à produire des morphologies réellement variées et fonctionnelles. Plusieurs équipes européennes, dont des laboratoires français travaillant sur la robotique adaptative, explorent des compromis similaires entre plasticité morphologique et transfert de politiques de contrôle. La piste ouverte par cette étude pointe vers des mécanismes d'héritage sélectif ou conditionnel, activés uniquement lorsque la similarité parent-descendant dépasse un seuil donné, une direction que les auteurs identifient comme prolongement naturel de ces résultats.

UELes équipes européennes et françaises travaillant sur la robotique évolutive et adaptative peuvent ajuster leur choix de mécanisme d'héritage selon le régime d'exploration morphologique visé, à la lumière de ces résultats expérimentaux.

RecherchePaper
1 source
DynoJEPP : estimation conjointe, prédiction et planification en environnements dynamiques
4arXiv cs.RO 

DynoJEPP : estimation conjointe, prédiction et planification en environnements dynamiques

DynoJEPP (Joint Estimation, Prediction and Planning) est un cadre de planification robotique basé sur les graphes de facteurs, publié le 14 mai 2026 sur arXiv (2605.12897), qui optimise simultanément trois modules traditionnellement traités en séquence : l'estimation d'état, la prédiction du comportement des objets environnants, et la planification de trajectoire. Le coeur de la contribution est l'introduction des "facteurs dirigés" (directed factors), un nouveau type de noeud dans le graphe de facteurs imposant un flux d'information strictement unidirectionnel entre les modules. Sans ce mécanisme, les informations issues de la prédiction et de la planification remontent dans l'estimateur d'état, corrompant les estimées et produisant des comportements non désirés. Le framework inclut également une extension baptisée Cooperative DynoJEPP, permettant au robot de modéliser un comportement coopératif des objets mobiles dans sa planification de trajectoire. L'impact le plus saillant ressort des expériences de validation : sans les facteurs dirigés, le robot entre en collision dans la majorité des tests, en environnement statique comme dynamique. Ce résultat pointe un problème fondamental des architectures JEPP existantes : la co-optimisation conjointe crée des boucles de rétroaction non désirées qui dégradent la sécurité opérationnelle. Le module d'estimation d'état, typiquement le composant de référence dans les systèmes de navigation, se retrouve contaminé par des hypothèses issues de la planification, inversant la causalité naturelle du pipeline. Pour les intégrateurs travaillant sur la navigation autonome en entrepôt ou en espace partagé humain-robot, l'approche suggère que la structure des dépendances entre modules est au moins aussi critique que leur optimisation conjointe. Les graphes de facteurs sont une technique établie en robotique depuis le milieu des années 2000, popularisée notamment par Frank Dellaert (Georgia Tech) via la librairie GTSAM pour le SLAM. Les approches JEPP suscitent un intérêt croissant face à la montée des robots en espaces dynamiques (entrepôts, routes mixtes, cobotique). Les concurrents directs incluent les planificateurs MPC à modules séparés, les architectures différentiables de type Wayve ou DreamerV3, et les VLA (Vision-Language-Action) qui intègrent progressivement la modélisation des agents environnants. La contribution de DynoJEPP reste au stade de la recherche académique (preprint sans revue par les pairs), sans déploiement ni pilote industriel annoncé.

RecherchePaper
1 source