Aller au contenu principal

Recherche — page 34

1654 articles · page 34 sur 34

Publications scientifiques en robotique : arXiv cs.RO, ICRA, IROS, Humanoids, CoRL — nouveaux algorithmes, benchmarks et datasets.

Modèle de diffusion adaptatif pour la manipulation robotique efficace (VADF)
1651arXiv cs.RO RecherchePaper

Modèle de diffusion adaptatif pour la manipulation robotique efficace (VADF)

Une équipe de chercheurs a publié sur arXiv (référence 2604.15938) une proposition architecturale baptisée VADF (Vision-Adaptive Diffusion Policy Framework), visant à corriger deux défauts structurels des politiques de diffusion appliquées à la manipulation robotique. Le premier défaut est le déséquilibre de classe dû à l'échantillonnage uniforme lors de l'entraînement : le modèle traite indistinctement les exemples faciles et difficiles, ce qui ralentit la convergence. Le second est le taux d'échec à l'inférence par dépassement de délai, un problème opérationnel concret dès qu'on sort du laboratoire. VADF intègre deux composants : l'ALN (Adaptive Loss Network), un MLP léger qui prédit en temps réel la difficulté de chaque pas d'entraînement et applique un suréchantillonnage des régions à forte perte via du hard negative mining ; et l'HVTS (Hierarchical Vision Task Segmenter), qui décompose une instruction de haut niveau en sous-tâches visuellement guidées, en assignant des schedules de bruit courts aux actions simples et des schedules longs aux actions complexes, réduisant ainsi la charge computationnelle à l'inférence. L'architecture est conçue model-agnostic, c'est-à-dire intégrable à n'importe quelle implémentation existante de politique de diffusion. L'intérêt pour un intégrateur ou un responsable R&D est avant tout pratique : les politiques de diffusion souffrent de coûts d'entraînement élevés et d'une fiabilité insuffisante en déploiement réel, ce qui freine leur adoption industrielle. Si les gains annoncés par VADF se confirment sur des benchmarks indépendants, la réduction des étapes de convergence représenterait un levier significatif sur les coûts GPU, et la diminution des timeouts à l'inférence améliorerait directement la cadence opérationnelle. Il faut toutefois noter que ce travail est un preprint non évalué par des pairs, sans chiffres de performance comparatifs publiés dans l'article lui-même. Les politiques de diffusion ont émergé comme méthode de choix pour l'imitation comportementale en robotique depuis les travaux de Chi et al. en 2023 (Diffusion Policy, Columbia), avant d'être intégrées dans des architectures plus larges comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. La principale tension du domaine reste le sim-to-real gap et la robustesse à l'inférence en conditions réelles, terrain sur lequel VADF prétend apporter une contribution. Les prochaines étapes logiques seraient une validation sur des benchmarks standard (RLBench, LIBERO) et une comparaison directe avec ACT ou Diffusion Policy de référence.

1 source
Créer l'écosystème d'agents ouverts ensemble : Présentation d'OpenEnv
1652HuggingFace Blog 

Créer l'écosystème d'agents ouverts ensemble : Présentation d'OpenEnv

Dans un effort concerté, des chercheurs et des développeurs ont présenté OpenEnv, un environnement open-source destiné à favoriser le développement d'agents intelligents et leur interaction dans diverses simulations. OpenEnv, soutenu par la fondation OpenAI, vise à standardiser les cadres d'entraînement pour les agents artificiels, rendant ainsi le processus d'apprentissage plus transparent et collaboratif. Ce projet inclut des simulations comme Roboschool et Meta-World, et compte des contributeurs de renom comme le laboratoire d'intelligence artificielle de l'Université de California, Berkeley.

UEOpenEnv, un environnement open-source pour agents intelligents, soutenu par la fondation OpenAI, impacte les entreprises européennes de l'IA en standardisant les cadres d'entraînement, potentiellement facilitant la conformité avec l'AI Act et renforçant la transparence, tout en favorisant la collaboration et l'innovation dans des secteurs comme la robotique et la simulation.

RechercheOutil
1 source
Robot Inference Asynchrone: Découplage Prédiction et Exécution d'Actions
1653HuggingFace Blog 

Robot Inference Asynchrone: Découplage Prédiction et Exécution d'Actions

Titre: Inférence robotique asynchrone : découplage de la prédiction et de l'exécution des actions Résumé : Cet article explore le concept d'inférence robotique asynchrone, qui sépare la prédiction des actions par un robot (modélisation) de leur exécution réelle (contrôle). Cette approche vise à améliorer la flexibilité et la robustesse des systèmes robotiques en permettant une adaptation plus rapide aux changements dans l'environnement ou les tâches. Le travail met en évidence l'efficacité de cette méthode à travers des expériences, montrant une amélioration dans la précision et la vitesse des réponses robotiques.

UEL'article présente une technologie d'inférence robotique asynchrone, qui pourrait améliorer la flexibilité et la robustesse des systèmes robotiques utilisés par des entreprises françaises comme Kuka ou ABB Robotics, en leur permettant de s'adapter plus rapidement aux changements environnementaux ou tâchés, potentiellement renforçant leur compétitivité dans l'UE en respectant les normes RGPD et AI Act en séparant la modélisation prédictive de l'exécution, garantissant ainsi une utilisation responsable et éthique de l'IA.

RecherchePaper
1 source
DABStep: Benchmark de l'Agent de Données pour la Raisonnement en Plusieurs Étapes
1654HuggingFace Blog 

DABStep: Benchmark de l'Agent de Données pour la Raisonnement en Plusieurs Étapes

Titre: DABStep - Banc d'essai pour agents de données pour la raisonnement à plusieurs étapes DABStep est un outil de banc d'essai conçu pour évaluer les capacités de raisonnement à plusieurs étapes des agents de données. Il simule des scénarios complexes où les agents doivent effectuer une série d'actions pour atteindre un objectif, comme la planification d'itinéraires ou la gestion de ressources. Les performances sont mesurées en termes de précision, d'efficacité et de robustesse. Les tests incluent des cas où les agents doivent gérer des informations incertaines ou changeantes.

UEDABStep, un outil de banc d'essai pour agents de données, pourrait améliorer la performance des systèmes de réalité augmentée et de navigation français en optimisant les algorithmes de planification d'itinéraires, conformes au RGPD en gérant efficacement les données personnelles.

RechercheOutil
1 source