
AERIS : intelligence à rôles en temps réel via un essaim orchestré de modèles de langage en périphérie aérienne
Une équipe de chercheurs publie sur arXiv (référence 2606.30151, soumis fin juin 2026) AERIS, un framework de déploiement edge conçu pour embarquer des modèles de langage sur des plateformes aériennes autonomes. L'architecture organise plusieurs petits modèles de langage spécialisés (SLM), associés à des modules de perception et de contrôle allégés, en "rôles" réassignables dynamiquement à l'exécution selon les ressources disponibles à bord. Pour respecter les contraintes de scheduling cadencées par heartbeat propres aux systèmes aériens, AERIS découple un planificateur basse fréquence et un contrôleur haute fréquence, maintenant une boucle perception-décision-contrôle closed-loop en temps réel. La décomposition d'instructions à long horizon repose sur un mécanisme dit "attention-subgoal alignment" : l'étape active de l'instruction est annotée dans les messages entre modules, permettant une progression incrémentale vers l'objectif global. Le framework a été évalué sur un benchmark VLN (Vision-and-Language Navigation) haute fidélité pour UAV, et deux expériences en conditions réelles ont validé capacité de planification et réactivité.
Ce travail s'attaque à un verrou bien identifié : la quasi-totalité des architectures LLM+robot supposent une connectivité cloud continue ou des ressources de calcul embarquées peu réalistes pour un drone. AERIS démontre qu'un raisonnement en langage naturel peut tourner localement sur UAV en substituant la taille des modèles par une orchestration fine des rôles. Le rebinding dynamique est potentiellement utile pour des flottes hétérogènes où les ressources varient d'une unité à l'autre. La limite notable : les deux expériences terrain restent des preuves de concept ciblées, sans métriques de déploiement à l'échelle, ni taux de succès mesuré en environnement non structuré.
L'intégration de LLMs dans les robots mobiles est portée depuis 2023 par SayCan (Google DeepMind), PaLM-E et les frameworks VLA comme Pi-0 de Physical Intelligence, mais ces travaux visent principalement les manipulateurs terrestres. Dans l'aérien, les contraintes énergétiques et de latence sont plus sévères, ce qui explique que la plupart des démos LLM+drone restent connectées au cloud. Des approches concurrentes sur l'inférence embarquée légère, notamment autour d'EdgeLLM ou des travaux de Microsoft Research sur les modèles compressés, explorent un espace voisin, mais rarement sur UAV. Aucun acteur européen n'est impliqué dans ce preprint. AERIS demeure un résultat académique sans partenaire industriel identifié ni roadmap de commercialisation ; la suite logique serait une validation sur flotte multi-agents en milieu dynamique non contrôlé.
Dans nos dossiers




