
Suivi de pose 6-DoF d'objets dynamiques par points clés et caméra événementielle
Des chercheurs ont publié sur arXiv (référence 2604.23387) une nouvelle méthode de suivi de pose d'objets en mouvement à six degrés de liberté (6-DoF), en s'appuyant sur des caméras événementielles plutôt que sur des caméras conventionnelles. L'approche repose sur la détection et le suivi de points-clés extraits du flux d'événements généré par le capteur. Le système identifie d'abord ces points-clés à partir d'une "surface temporelle" construite à partir du signal événementiel, puis exploite la polarité et les coordonnées spatiales des événements pour assurer un suivi continu. Une correspondance par table de hachage est ensuite établie entre les points-clés 2D détectés et les points-clés du modèle 3D de l'objet, avant d'appliquer l'algorithme EPnP pour calculer la pose finale. Testée en environnements simulés et réels, la méthode surpasse les approches concurrentes basées sur les événements en précision et en robustesse.
Cette avancée répond à un besoin critique en robotique industrielle : estimer avec précision l'orientation et la position d'un objet en mouvement rapide pour permettre des tâches de manipulation fiables. Les caméras classiques échouent dans ce contexte précis, car elles souffrent de flou de mouvement lors de déplacements rapides, de bruit de capteur et de performances dégradées en faible luminosité. Une estimation de pose erronée peut compromettre entièrement une opération de saisie ou d'assemblage automatisé. La méthode proposée ouvre donc la voie à des bras robotiques capables d'attraper des objets en mouvement dans des conditions difficiles, ce qui intéresse directement les secteurs de la logistique, de la chirurgie assistée par robot et de la fabrication automatisée.
Les caméras événementielles, initialement développées pour l'inspiration biologique par des institutions comme l'ETH Zurich et commercialisées notamment par Prophesee ou iniVation, mesurent les changements de luminosité pixel par pixel avec une latence de l'ordre de la microseconde, sans produire d'images complètes. Longtemps cantonnées à la recherche fondamentale, elles gagnent progressivement du terrain dans les applications embarquées et robotiques. Ce travail illustre comment coupler ces capteurs atypiques à des architectures d'apprentissage profond peut résoudre des problèmes insolubles pour l'imagerie traditionnelle, notamment dans les scénarios haute vitesse ou faible contraste. La prochaine étape probable sera l'intégration de cette approche dans des pipelines temps réel sur matériel embarqué contraint.
Prophesee, startup française pionnière dans la commercialisation des caméras événementielles, est citée comme acteur clé de l'écosystème sur lequel ces travaux s'appuient, ce qui renforce son positionnement sur le marché européen de la robotique industrielle.




