Suivi de l'essor de l'IHR sociale-physique (spHRI) : revue systématique augmentée par de petits modèles de langage
Des chercheurs ont publié sur arXiv (2606.26382) une étude méthodologique sur l'utilisation de petits modèles de langage (SLMs, moins de 1,5 milliard de paramètres) pour accélérer les revues systématiques dans le domaine de l'interaction humain-robot sociale et physique (spHRI). L'équipe a évalué la capacité de ces modèles à effectuer le tri préliminaire de titres et de résumés dans le cadre d'une large revue de littérature spHRI. Aucun SLM testé individuellement n'a atteint le niveau de performance des relecteurs humains. En revanche, un ensemble de SLMs combinés a identifié 39 articles que les experts avaient manqués, soit 10,29 % du corpus final de documents pertinents. Ces modèles ont effectué le tri à une vitesse plusieurs ordres de grandeur supérieure à celle des relecteurs humains, en fonctionnant intégralement en local sur les machines des chercheurs.
Le résultat clé est que les SLMs peuvent augmenter le travail des experts sans les remplacer. Dans un domaine comme la spHRI, qui recupe la robotique, l'interaction humain-ordinateur et l'haptique, la terminologie est fragmentée et les méthodologies inconsistantes, ce qui rend toute synthèse systématique difficile. Utiliser un ensemble de SLMs comme filet de sécurité permet de récupérer environ 10 % des articles pertinents qu'une révision humaine seule aurait manqués. Le déploiement local de ces modèles, contrairement aux APIs cloud, préserve la confidentialité des données de recherche, élimine les coûts d'inférence et rend les revues systématiques à grande échelle accessibles pour des équipes académiques aux ressources limitées.
Cette étude s'inscrit dans une tendance plus large d'utilisation des LLMs pour accélérer la recherche scientifique, notamment pour le screening bibliographique, tâche chronophage et répétitive. Le choix délibéré de modèles inférieurs à 1,5B paramètres contraste avec le recours à des APIs comme GPT-4 ou Claude, qui offrent de meilleures performances individuelles mais imposent coûts et dépendances cloud. Les résultats valident un pipeline hybride humain + SLM local: les modèles effectuent un premier tri rapide, les experts valident. Pour les laboratoires gérant des revues de plusieurs milliers de papiers, ce type de pipeline pourrait réduire significativement la charge de travail sans sacrifier la rigueur méthodologique, et ouvrir la voie à des revues systématiques continues plutôt qu'épisodiques.
Dans nos dossiers




