C-3TO : optimisation continue de trajectoires 3D…

PISTO : inférence proximale pour l'optimisation stochastique de trajectoires

39

1arXiv cs.RO

PISTO : inférence proximale pour l'optimisation stochastique de trajectoires

Des chercheurs ont publié sur arXiv (arXiv:2605.07215) un algorithme de planification de trajectoires robotiques appelé PISTO (Proximal Inference for Stochastic Trajectory Optimization). Leur contribution centrale est de démontrer que STOMP, méthode stochastique classique, minimise implicitement une divergence KL par rapport à une distribution de trajectoires de Boltzmann, révélant une structure d'inférence variationnelle (VI) sous-jacente. PISTO exploite cette observation en ajoutant une régularisation KL entre propositions gaussiennes successives, ce qui stabilise les mises à jour et produit une interprétation de type trust-region. L'algorithme reste entièrement sans dérivées et s'appuie sur un échantillonnage Monte Carlo à pondération d'importance. Sur les benchmarks de planification de bras robotiques, PISTO atteint 89 % de taux de succès contre 63 % pour CHOMP et 68 % pour STOMP, tout en générant des trajectoires plus courtes et plus lisses, à deux fois la vitesse des méthodes stochastiques concurrentes. Des validations complémentaires sur des tâches de locomotion et manipulation contact-rich en simulation MuJoCo montrent des performances supérieures aux baselines CEM et MPPI en termes de récompense cumulée. Pour les intégrateurs et ingénieurs en planification de mouvement, l'absence totale de dérivées est une caractéristique décisive : elle permet de traiter des fonctions de coût non-différentiables ou discontinues, fréquentes dans les environnements industriels réels (détection de collisions, zones interdites, contraintes non paramétriques). Le gain de vitesse d'un facteur deux par rapport aux méthodes stochastiques existantes réduit directement les temps de cycle dans les applications de planification en ligne, point critique pour la robotique collaborative et les systèmes pick-and-place haute cadence. La validation sur MuJoCo avec contacts ouvre des perspectives vers la locomotion humanoïde et la manipulation dextre, bien que ces résultats restent pour l'instant entièrement simulés, sans validation sur matériel physique. PISTO s'inscrit dans la lignée de STOMP (développé chez Willow Garage et présenté à l'ICRA 2011) et de ses concurrents gradient-based tels que CHOMP, ainsi que des méthodes stochastiques modernes MPPI (popularisé par NVIDIA en 2017) et CEM. Soumis comme preprint arXiv sans révision par les pairs à ce stade, l'article n'annonce ni déploiement industriel ni partenariat commercial. Son impact pratique dépendra de la mise à disposition du code source et de validations expérimentales sur robot réel, étapes absentes de la publication actuelle.

RecherchePaper

1 source

Gradients fonctionnels naturels pour l'optimisation de trajectoires fluides

40

2arXiv cs.RO

Gradients fonctionnels naturels pour l'optimisation de trajectoires fluides

Une équipe de chercheurs a soumis sur arXiv (référence 2605.28202, mai 2026) un framework d'optimisation de trajectoire pour la manipulation robotique dans des environnements encombrés ou à passages étroits. La méthode introduit ce que les auteurs nomment des "gradients fonctionnels naturels" : plutôt que d'opérer dans un espace discret de waypoints, les mises à jour sont calculées directement dans l'espace fonctionnel, découplant la régularité de la trajectoire du pas de discrétisation temporelle. L'algorithme optimise un objectif lissé par noyau gaussien et emploie un estimateur Monte-Carlo du gradient naturel, ce qui le rend utilisable sans gradients analytiques, un avantage déterminant lorsque la détection de collision ou les simulations à contacts riches empêchent toute différentiation exacte. Les expériences portent sur des tâches de manipulation contrainte aux dégagements géométriques étroits. Pour un intégrateur ou un ingénieur en manipulation, l'apport concret réside dans la capacité à produire des trajectoires faisables là où des planificateurs établis comme CHOMP, TrajOpt ou GPMP2 peinent à converger ou génèrent des mouvements saccadés. La compatibilité "boîte noire" avec n'importe quel simulateur de contacts ouvre également la voie à une intégration dans des pipelines sim-to-real existants sans modifier le moteur physique sous-jacent. Les résultats présentés montrent une amélioration mesurable de la faisabilité et du lissé par rapport à ces baselines, bien que le préprint ne soit pas encore soumis à comité de lecture et que les conditions précises d'évaluation restent à examiner de façon indépendante. L'optimisation de trajectoire est un problème central depuis CHOMP (2009) et TrajOpt (2013) ; l'idée de gradient naturel, issue des travaux d'Amari en apprentissage statistique, n'avait pas encore été formalisée dans l'espace fonctionnel des trajectoires robotiques. Ce travail s'inscrit dans une dynamique active où les méthodes d'optimisation classique doivent maintenir leur pertinence face aux politiques diffusion et aux VLA (Vision-Language-Action models, modèles action guidés par le langage et la vision), qui représentent aujourd'hui une approche concurrente croissante pour la manipulation en espace contraint. Le code source et les vidéos de démonstration sont accessibles sur la page projet des auteurs ; une soumission à ICRA, IROS ou CoRL constituerait la prochaine étape naturelle de validation.

RecherchePaper

1 source

Robotique forestière : optimisation stochastique de trajectoire sous contraintes pour une grue forestière optimale en temps

42

3arXiv cs.RO

Robotique forestière : optimisation stochastique de trajectoire sous contraintes pour une grue forestière optimale en temps

Des chercheurs présentent TSC-VP-STO, une extension de l'algorithme VP-STO (Via-Point-based Stochastic Trajectory Optimization) destinée à la planification de trajectoires pour les grues forestières autonomes. Le problème initial de VP-STO est qu'il impose une configuration articulaire terminale fixe, définie avant même l'optimisation, ce qui limite l'exploitation de la redondance cinématique propre à ces bras manipulateurs à plusieurs degrés de liberté (DOF). TSC-VP-STO remplace cette contrainte rigide par une contrainte dans l'espace de la tâche, permettant d'optimiser conjointement la trajectoire et les degrés de liberté redondants de la posture finale. Les auteurs formalisent l'approche via une décomposition de l'espace de configuration et une contrainte d'atteignabilité spécifique à la cinématique des grues forestières. Les essais, menés sur plusieurs cibles de planification et configurations de points de passage, montrent une réduction de 12 à 15% de la durée des trajectoires en moyenne par rapport à VP-STO, avec une meilleure répartition de l'utilisation du débit hydraulique. La méthode a été validée en conditions réelles sur une grue forestière, incluant un cycle complet de chargement de grumes. L'enjeu dépasse le seul cas des grues forestières: il touche à l'automatisation de tout manipulateur hydraulique cinématiquement redondant soumis à des contraintes de débit de pompe non linéaires et globalement couplées, un problème classique en robotique industrielle lourde (foresterie, BTP, manutention). Optimiser la posture terminale plutôt que de la figer permet de mieux équilibrer la demande hydraulique entre articulations, un gain concret pour les intégrateurs cherchant à réduire les temps de cycle sans changer le matériel. La validation sur machine réelle, et pas seulement en simulation, renforce la crédibilité des gains annoncés, un point que les décideurs industriels scrutent généralement avec prudence face aux démonstrations purement simulées. Ce travail s'inscrit dans la continuité de VP-STO, déjà présenté comme quasi temps-optimal pour la planification hybride de grues forestières, et prolonge une littérature plus large sur l'optimisation stochastique de trajectoires sous contraintes robotiques. Publié comme prépublication arXiv, il reste à ce stade un résultat de recherche appliquée plutôt qu'un produit commercialisé, mais son déploiement réel sur une grue en exploitation forestière constitue une étape notable vers une adoption industrielle.

UECette optimisation profite potentiellement aux intégrateurs robotiques européens du secteur forestier et de la manutention lourde (Scandinavie, BTP), sans acteur français ou européen explicitement cite dans l'article.

RecherchePaper

1 source

Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension

37

4arXiv cs.RO

Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension

Des chercheurs présentent dans un preprint arXiv (2502.16205, version 3) une représentation implicite neurale des obstacles pour la planification de trajectoire des manipulateurs de picking industriels : la nSCDF (neural signed configuration distance function). Ces robots spécialisés, dotés de moins de degrés de liberté que les bras polyvalents, sont massivement déployés en logistique et manufacturing. Le verrou adressé est précis : les planificateurs multi-requêtes à base d'échantillonnage (type PRM, RRT), méthodes de référence industrielle, s'appuient lourdement sur la détection de collision et deviennent inadaptés à la replanification en temps réel. La nSCDF est une fonction neurale calculant la distance signée d'une configuration à l'espace de collision, permettant de construire des "boules" sans collision dans l'espace de configuration. Ces boules remplacent les points dans le graphe du planificateur, qui retourne alors un couloir sans collision exploitable par un solveur de programmation convexe. Les expériences numériques rapportent des trajectoires proches de celles d'un planificateur asymptotiquement optimal (RRT*), obtenues en temps significativement inférieur, sans que l'abstract ne précise de chiffres concrets de speedup. L'enjeu est direct pour les intégrateurs : le rendement des robots de picking dépend critiquement de la vitesse de planification, en particulier dans les environnements semi-structurés où obstacles et pièces varient à chaque cycle. Un planificateur online capable de replanifier à la volée réduit les temps de cycle et supprime le besoin de précomputer des roadmaps statiques. La nSCDF vise à court-circuiter les appels répétés aux moteurs de collision classiques (FCL, Bullet), goulot d'étranglement connu des stacks motion planning. Le résultat clé est d'atteindre une qualité quasi-optimale de trajectoire sans payer le coût computationnel des méthodes asymptotiquement optimales, compromis précisément recherché pour l'intégration en production. Ce travail s'inscrit dans la tendance des représentations implicites neuronales appliquées à la robotique, dans la lignée des champs de distance euclidiens appris (ESDF) et des Neural Distance Fields. Les planificateurs sampling-based classiques restent la référence industrielle mais peinent en contexte online ; des groupes concurrents explorent des approches similaires via politiques d'évitement apprises ou représentations occupancy neuronales. Il s'agit d'un preprint en version 3, ce qui indique plusieurs cycles de révision mais pas encore une publication dans une conférence de référence (ICRA, IROS, RA-L) : les résultats restent à valider par les pairs sur du matériel réel. Aucun partenaire industriel ni déploiement physique n'est mentionné.

UEAvancée en planification de trajectoire en ligne potentiellement utile pour les intégrateurs européens de robots de picking, mais aucun partenariat ni déploiement EU mentionné.

RecherchePaper

1 source

C-3TO : optimisation continue de trajectoires 3D sur champs de distances euclidiennes signées neuronaux

À lire aussi

PISTO : inférence proximale pour l'optimisation stochastique de trajectoires

Gradients fonctionnels naturels pour l'optimisation de trajectoires fluides

Robotique forestière : optimisation stochastique de trajectoire sous contraintes pour une grue forestière optimale en temps

Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension