Seq-DeepIPC : captation séquentielle pour le contrôle de bout en bout dans la navigation de robots à pattes
Des chercheurs présentent Seq-DeepIPC (arXiv:2510.23057v2), un modèle de navigation bout-en-bout pour robots à pattes reposant sur une fusion multi-modale RGB-D et GNSS. Contrairement aux approches classiques qui séparent perception et contrôle, le système prédit conjointement la segmentation sémantique et l'estimation de profondeur à partir d'entrées séquentielles, puis génère directement les commandes moteur. L'estimation du cap global est assurée non pas par une centrale inertielle (IMU), jugée trop bruitée, mais par une analyse différentielle de coordonnées GNSS successives. Pour le déploiement embarqué, un encodeur léger réduit la charge de calcul sans dégradation significative de précision. Le système a été validé sur un robot quadrupède sur deux types de terrain, route et gazon, à partir d'un jeu de données collecté spécifiquement pour couvrir cette diversité. Le code sera mis en accès libre sur GitHub (github.com/oskarnatan/Seq-DeepIPC).
L'apport principal réside dans l'extension de la navigation end-to-end, jusqu'ici dominée par les robots à roues, aux systèmes à pattes, beaucoup plus complexes cinématiquement. Les études ablatives confirment que les entrées séquentielles améliorent à la fois la perception et le contrôle dans Seq-DeepIPC, alors que les baselines testées n'en bénéficient pas, ce qui suggère une dépendance forte à la temporalité propre à la démarche quadrupède. La suppression de l'IMU est un choix architectural audacieux: elle simplifie l'intégration matérielle et évite la dérive gyroscopique, mais le papier reconnaît une fiabilité moindre du cap GNSS-seul en environnement urbain dense. Pour un intégrateur, cela signifie que le système est crédible en extérieur ouvert, mais nécessiterait une fusion sensorielle supplémentaire en milieu confiné ou bâti.
La navigation end-to-end pour robots à pattes s'inscrit dans un effort de recherche plus large visant à réduire le gap de spécialisation entre planification et locomotion. Des travaux comme DeepIPC (dont Seq-DeepIPC est la suite directe) ou les architectures VLA (Vision-Language-Action) de Boston Dynamics, Unitree et ANYbotics explorent des pipelines similaires, avec des approches différentes sur la représentation de l'espace et la gestion de la mémoire temporelle. Seq-DeepIPC se distingue par sa sobriété sensorielle et sa cible embarquée, mais reste un prototype de laboratoire validé en conditions semi-contrôlées. La prochaine étape logique serait un test en environnements plus adversariaux, notamment urbains, pour quantifier les limites réelles du cap GNSS différentiel annoncées dans le papier.
Dans nos dossiers



