RecherchearXiv cs.RO6sem

Comparaison des performances des algorithmes d'échantillonnage classiques et neuronaux pour la navigation robotique

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié sur arXiv (référence 2505.25010) une étude comparative de trois algorithmes de planification de trajectoire par échantillonnage appliqués à la navigation robotique et aux drones : RRT (l'algorithme de référence basé sur les arbres aléatoires exploratoires), Neural RRT et Neural Informed RRT, ces deux derniers intégrant des réseaux de neurones pour guider la phase d'échantillonnage. Les tests ont été conduits dans des environnements simulés comportant des obstacles convexes et concaves à densités variables. Les résultats montrent que les variantes neurales génèrent des chemins jusqu'à 14% plus courts et des trajectoires 55 à 75% plus lisses que l'algorithme classique. Neural Informed RRT obtient les meilleures performances globales sur les deux critères évalués, au prix d'une légère hausse du temps de calcul non chiffrée dans l'abstract.

Pour un intégrateur de flotte AMR (robots mobiles autonomes) ou un responsable technique travaillant sur des drones d'inspection, une réduction de 55 à 75% de la rugosité de trajectoire se traduit directement par moins de sollicitations mécaniques, une meilleure durée de vie des actionneurs et une consommation énergétique réduite. Le gain de 14% sur la longueur de chemin représente un avantage cumulatif significatif sur des cycles répétitifs en entrepôt ou en milieu industriel. L'étude valide l'hypothèse que le neural sampling peut améliorer la qualité du planificateur sans remplacer entièrement le moteur classique, une architecture hybride qui facilite l'intégration dans les pipelines existants. Le surcoût computationnel reste cependant non quantifié précisément dans les résultats publiés, ce qui limite l'évaluation de la viabilité temps-réel sans accès au corpus complet.

La planification par échantillonnage repose sur RRT*, algorithme asymptotiquement optimal formalisé par Karaman et Frazzoli en 2011 et devenu un standard dans les frameworks open-source OMPL et MoveIt 2. L'injection de réseaux de neurones dans la phase d'échantillonnage est explorée depuis plusieurs années via des approches comme MPNet (2019) ou NeuralRRT, qui biaisent l'exploration vers les zones de l'espace prometteuses plutôt que d'échantillonner uniformément. Ce preprint, non encore peer-reviewed au moment de sa publication, s'inscrit dans un courant plus large de planification hybride classique/IA également suivi par des équipes chez Boston Dynamics, Skydio, et dans les laboratoires de manipulation de Figure AI ou 1X Technologies. La prochaine étape logique est une validation sur hardware réel avec des benchmarks standardisés, indispensable avant tout déploiement industriel.

Dans nos dossiers

Figure 1X Technologies Boston Dynamics arXiv cs.RO

À lire aussi

1arXiv cs.RO

Combinaison d'échantillonnage contraint et d'apprentissage par renforcement pour la manipulation robotique

Manipulation robotique non préhensile : des chercheurs de la TU Berlin combinent échantillonnage contraint et apprentissage par renforcement Une équipe de la TU Berlin, associée au laboratoire de Marc Toussaint, publie une nouvelle version de ses travaux sur l'entraînement de politiques de manipulation robotique en environnement riche en contacts (arXiv:2602.08557v2). Le problème visé est la manipulation dite non préhensile, c'est à dire pousser, faire glisser ou réorienter un objet sans le saisir, une tâche où l'apprentissage par renforcement (RL) peine souvent à explorer suffisamment l'espace des stratégies possibles. La méthode proposée combine deux idées existantes mais rarement associées : d'une part des stratégies de réinitialisation qui contrôlent la distribution des états de départ de chaque épisode d'entraînement, et d'autre part un échantillonnage basé modèle sur des variétés contraintes, une technique reconnue pour son efficacité à générer des états physiquement valides. Le nouvel échantillonneur tient explicitement compte de la structure des contacts pour couvrir un large éventail de modes de contact, le tout combiné à une interpolation projetée et à un apprentissage curriculaire progressif. Sur le plan des résultats, l'équipe affirme surpasser à la fois le RL classique sans échantillonnage contraint et les méthodes alternatives de réinitialisation, en entraînant des politiques universelles, non préhensiles et dynamiques. L'intérêt pour le secteur tient moins à un produit qu'à une brique méthodologique : la manipulation en contact riche, aujourd'hui l'un des points durs de la robotique appliquée (tri industriel, réorientation d'objets sur convoyeur, préhension d'objets déformables), reste largement dominée par des politiques apprises en simulation qui échouent à généraliser sur des configurations de contact non vues à l'entraînement. Une méthode qui améliore la couverture des modes de contact pendant l'apprentissage adresse directement ce problème de généralisation, sans dépendre d'un matériel ou d'un actionneur particulier. Il s'agit ici d'une contribution académique, pas d'une annonce produit ni d'un déploiement industriel, du matériel supplémentaire étant disponible sur le site du laboratoire. Le travail s'inscrit dans la continuité des recherches de Toussaint sur la planification géométrico logique et les approches hybrides modèle/apprentissage, un courant de recherche européen qui contraste avec les approches purement data-driven (type VLA) privilégiées par les laboratoires américains sur les plateformes humanoïdes commerciales.

UEContribution de la TU Berlin (laboratoire de Marc Toussaint) qui renforce l'expertise europeenne en manipulation robotique hybride modele/apprentissage, une approche qui se distingue des methodes VLA data-driven privilegiees par les laboratoires americains.

RecherchePaper

1 source

2arXiv cs.RO

Actionneurs pneumatiques souples pour la robotique molle : revue des mécanismes d'actionnement et compromis de performance

Une équipe de chercheurs vient de déposer sur arXiv (réf. 2605.25109) une revue systématique des actionneurs pneumatiques souples, constituant l'une des technologies centrales de la robotique souple. Le papier organise ces systèmes selon quatre classes de mouvement : linéaire, flexion, torsion et omnidirectionnel. Pour chaque classe, les auteurs analysent les paramètres structurels qui définissent le chemin de déformation : angle de tresse, géométrie des plis, orientation des fibres, arrangement des chambres, asymétrie structurelle et couches de contrainte internes. Le constat de départ est net : la réponse mécanique de ces actionneurs ne dépend pas uniquement de la pression appliquée, mais de l'ensemble de leur architecture, ce que la littérature existante traite de façon fragmentée et difficilement comparable. L'intérêt de ce travail tient à un problème concret qui ralentit les équipes de développement : l'impossibilité de comparer les résultats publiés entre études. Deux actionneurs à base de flexion peuvent produire des déplacements similaires tout en différant radicalement sur la demande en débit d'air, la répétabilité ou la durée de vie en cycles. La revue introduit un cadre de conditions de sélection explicites à évaluer lors du choix ou de la comparaison d'actionneurs : pression de travail, condition de charge, taille physique de l'actionneur, disponibilité de l'alimentation pneumatique et hystérésis. Pour un intégrateur ou un ingénieur robotique, ce cadre réduit les essais empiriques coûteux en phase de prototypage, à condition que les publications futures adoptent ces métriques de manière systématique, ce qui reste une hypothèse de travail à ce stade. La robotique souple s'est imposée comme alternative aux systèmes rigides pour des applications en contact avec le corps humain ou des environnements non structurés, en compétition directe avec les actionneurs à câbles, les élastomères diélectriques et les alliages à mémoire de forme. Les applications visées par la revue sont explicitement le biomédical, le portabilité et la robotique mobile. En Europe, des acteurs comme Wandercraft sur les exosquelettes ou Enchanted Tools sur les robots collaboratifs opèrent précisément dans des espaces où ces arbitrages de conception sont déterminants. Ce papier de classification arrive au moment où plusieurs équipes tentent le passage du prototype de laboratoire au déploiement industriel, une transition qui exige la rigueur comparative que cette revue cherche à structurer, sans toutefois proposer de benchmarks quantitatifs normalisés propres à accélérer ce saut.

UELe cadre de sélection proposé est directement exploitable par des équipes françaises comme Wandercraft (exosquelettes) et Enchanted Tools (robots collaboratifs) pour réduire les essais empiriques lors du choix d'actionneurs souples en phase de prototypage.

RecherchePaper

1 source

3arXiv cs.RO

Convex-Neural RRT* : échantillonnage guidé par apprentissage pour une planification de trajectoire robotique rapide et fiable

Une équipe de recherche a publié en mai 2026 sur arXiv (réf. 2605.25006) les travaux sur Convex-Neural RRT, une variante de l'algorithme de planification de chemin RRT intégrant un guidage neuronal pour accélérer la recherche de trajectoires optimales. Le principe : un réseau de neurones prédit des régions "waypoints" prometteuses autour des chemins de haute qualité, puis des zones convexes sont extraites de ces prédictions pour concentrer l'exploration sur les zones géométriquement pertinentes tout en maintenant une couverture globale de l'espace. Évalué sur 18 cartes de benchmark réparties en 3 types d'environnements, l'algorithme réduit le temps de calcul de 30 à 75 % par rapport aux variantes neurales existantes (Neural RRT, Neural Informed RRT), et de 88 à 98 % par rapport à LTA. La longueur des chemins produits diminue en moyenne de 5 % par rapport au RRT classique, avec des gains plus marqués dans les environnements complexes. Le taux de succès reste supérieur à 99 % quelle que soit la densité d'obstacles. Ces résultats s'attaquent à un goulot d'étranglement bien documenté du planning probabiliste : les méthodes à base d'échantillonnage sont théoriquement complètes mais lentes à converger vers des solutions de qualité, ce qui freine leur déploiement embarqué où le temps de réponse est critique (robots mobiles, bras industriels, véhicules autonomes). L'utilisation de zones convexes comme proxy des prédictions neuronales est une décision d'ingénierie notable : elle préserve les garanties de convergence de RRT* tout en rendant l'heuristique géométriquement tractable, évitant les dérives habituelles des méthodes purement apprises qui échouent hors distribution. À noter que les gains de 5 % en longueur de chemin restent modestes et que les benchmarks sont réalisés en simulation ; aucune validation sur robot physique n'est rapportée. RRT (Rapidly-exploring Random Tree Star), introduit par Karaman et Frazzoli en 2011, est devenu un standard en planification de mouvement robotique. Ses variantes neurales récentes ont cherché à apprendre des heuristiques d'échantillonnage depuis des données de trajectoires, mais au prix d'une surcharge computationnelle qui annulait souvent le bénéfice. Convex-Neural RRT s'inscrit dans cette lignée en ajoutant une contrainte géométrique qui assainit les prédictions. Les concurrents directs incluent LTA, IRRT et les approches par diffusion (Motion Planning Diffusion). Cette publication préliminaire ne mentionne aucun déploiement industriel ; les prochaines étapes attendues sont une validation sur robots physiques et une extension aux espaces de configuration de haute dimension, notamment les bras 6-7 DOF et les humanoïdes.

RecherchePaper

1 source

4arXiv cs.RO

E²DT : Decision Transformer efficace avec échantillonnage guidé par l'expérience pour la manipulation robotique

Une équipe de chercheurs a publié en mai 2026 sur arXiv (référence 2605.00159) un nouveau cadre d'apprentissage par renforcement pour la manipulation robotique, baptisé E²DT (Efficient and Effective Decision Transformer). Le système s'appuie sur l'architecture Decision Transformer (DT), qui traite l'apprentissage par renforcement comme un problème de modélisation de séquences, et y intègre un mécanisme de sélection d'expériences fondé sur un k-Processus Ponctuel Déterminantal (k-DPP). Concrètement, E²DT remplace le replay uniforme standard par un échantillonnage guidé combinant trois critères : le retour cumulatif attendu (return-to-go, RTG), l'incertitude prédictive du modèle, et la représentativité des phases de la tâche via une fréquence inverse. La méthode est évaluée sur des benchmarks de manipulation robotique en simulation et sur robot réel, et surpasse systématiquement les approches antérieures, selon les auteurs. Le problème adressé est concret et bien connu des équipes de R&D : le Decision Transformer standard tire ses trajectoires d'entraînement de façon uniforme depuis le replay buffer, ce qui aboutit à une mauvaise efficacité d'échantillonnage, une exploration limitée et une convergence sous-optimale, particulièrement pénalisant sur des tâches à long horizon où les transitions rares sont décisives. E²DT propose un noyau joint qualité-diversité qui force le modèle à sélectionner activement les expériences les plus informatives, en mesurant la diversité via les embeddings latents internes du DT lui-même. Pour les intégrateurs industriels travaillant sur des bras manipulateurs ou des cellules robotisées, cela ouvre un chemin vers des politiques robustes avec moins de données de démonstration, réduisant potentiellement les cycles de mise en production. Le Decision Transformer, introduit par Chen et al. en 2021, a rapidement été adopté comme référence dans de nombreux travaux de manipulation. Ses faiblesses liées au replay passif ont déjà motivé des variantes comme l'Online Decision Transformer ou des approches à experience replay prioritaire (PER). E²DT s'inscrit dans cette lignée en combinant diversité et qualité composite dans un unique cadre d'échantillonnage. Aucune affiliation industrielle ni timeline de déploiement n'est mentionnée dans le preprint : il s'agit d'une contribution académique, sans produit ni partenariat annoncé à ce stade.

RecherchePaper

1 source