
DiscreteRTC : les politiques de diffusion discrète comme exécuteurs asynchrones naturels
Des chercheurs ont publié DiscreteRTC, une nouvelle architecture de contrôle pour l'IA physique qui résout un problème fondamental des robots en temps réel : comment continuer à agir pendant que le cerveau artificiel calcule la prochaine décision. Présenté sur arXiv le 29 avril 2026, ce travail propose de remplacer les approches de diffusion continue actuelles par des politiques de diffusion discrète, qui génèrent des actions en démasquant itérativement des séquences plutôt qu'en les construisant de zéro. Les résultats sont frappants : sur des tâches de manipulation dynamique en conditions réelles, DiscreteRTC atteint un taux de succès supérieur de 50 % à celui du RTC basé sur le flow-matching, tout en utilisant seulement 0,7 fois la puissance de calcul d'une génération complète, et sans nécessiter une seule ligne de code supplémentaire pour la gestion asynchrone.
L'enjeu est structurel pour tout ce qui touche à la robotique et à l'IA embarquée. Contrairement aux chatbots, un robot ne peut pas mettre le monde en pause pendant qu'il réfléchit : une pause de quelques dizaines de millisecondes suffit à rater un objet en mouvement ou à perdre l'équilibre. Les systèmes synchrones existants, aussi rapides soient-ils, souffrent de ce décalage fatal entre calcul et action. DiscreteRTC résout cela en faisant de l'exécution asynchrone une propriété native du modèle : le système "pense en agissant", en figeant les actions déjà engagées et en générant la suite de façon cohérente, sans correction externe coûteuse.
Cette approche s'inscrit dans une course plus large à rendre l'IA générative utilisable dans des environnements physiques contraints. Les méthodes de flow-matching, popularisées par des équipes comme OpenAI ou des laboratoires académiques, souffrent d'un défaut architectural : leur capacité d'inpainting est une rustine ajoutée à l'inférence plutôt qu'une propriété fondamentale, ce qui impose du fine-tuning spécifique, des heuristiques fragiles et une latence accrue. En choisissant la diffusion discrète comme base, DiscreteRTC fait de la complétion de séquence son opération native, ouvrant la voie à des robots capables de réagir en temps réel sans compromis sur la cohérence des mouvements. Les prochaines étapes pourraient inclure des tests sur des plateformes robotiques plus complexes et une intégration dans des pipelines d'entraînement à grande échelle.




