Intact, faire parler les réseaux sociaux pour mieux gérer les crises
L’analyse des messages émis sur les réseaux sociaux peut aider à détecter les signaux faibles permettant de gérer les crises écologiques, industrielles, sanitaires ou de maintien de l’ordre. Le projet de recherche Intact, porté par les chercheuses Farah Benamara et Alda Mari, exploite des techniques avancées en linguistique et de nouveaux modèles informatiques d’intelligence artificielle hybride. Un démonstrateur déjà opérationnel a été présenté au salon Innovatives SHS 2022, le salon de la valorisation en sciences humaines et sociales du CNRS.
Farah Benamara et Alda Mari se connaissaient depuis la fin de leurs études universitaires il y a une vingtaine d'années avant de décider, en 2018, de répondre ensemble à un appel à projet. Émanant du ministère de l’Intérieur, celui-ci visait à analyser les messages textuels partagés sur les réseaux sociaux pour une aide à la décision. Afin de comprendre ces messages, d’extraire les informations utiles et d’automatiser leur analyse, plusieurs domaines de recherche sont sollicités, notamment la linguistique et la linguistique computationnelle, deux domaines d’expertise des équipes de Farah Benamara et Alda Mari.
Farah Benamara est maîtresse de conférences en informatique à l’université Toulouse III – Paul Sabatier ; elle travaille à l’Institut de recherche en informatique de Toulouse1 , dans l’équipe Méthodes et ingénierie des langues, des ontologies et du discours dont elle est la co-responsable. De son côté, Alda Mari est directrice de recherche au CNRS et dirige l’équipe Langage, pensée et comportement à l’Institut Jean Nicod2 , au département Sciences cognitives de l’École Normale Supérieure à Paris.
« En répondant à un premier appel à projet de la direction générale de la sécurité civile et de la gestion des crises, puis à un deuxième, explique Farah Benamara, nous avons déjà une preuve de concept et sommes en phase de prématuration afin que le prototype acquière une robustesse et puisse être utile à un maximum d’acteurs spécialisés dans la gestion des crises. L’objectif était d’analyser et d’extraire automatiquement les informations les plus utiles et pertinentes afin de prédire les actions à entreprendre en cas de crise et nous y sommes parvenues. »
13 000 tweets analysés
L’équipe d’Alda Mari s’est chargée de la partie proprement linguistique du projet : « Nous avons annoté manuellement un corpus de 13 000 tweets postés pendant plusieurs crises. Avec la direction générale de la sécurité civile et de la gestion des crises, nous avons analysé tous ces messages, cherché à déterminer quels sont les plus importants, comment ils sont formulés et quel caractère d’urgence d’une situation ils expriment. Certains messages ne sont d’aucune utilité mais d’autres sont importants : une information sur les dégâts humains ou matériels, un véhicule demande de l’aide, etc.
Le projet nécessite donc d’étudier en profondeur les mécanismes linguistiques permettant de prédire les actions à entreprendre. Il faut dépasser le simple ‘mot à mot’ et mettre en œuvre une analyse sémantique profonde des signaux d’intentions c’est-à-dire les désirs, craintes ou encore les plans. Les messages sont ensuite classés en différentes catégories de façon à créer un corpus de référence en français annoté selon les intentions d’agir de l’auteur. Cette typologie sert à développer des modèles d'apprentissage automatique ».
C’est à ce stade qu’intervient l’équipe de Farah Benamara spécialisée dans le traitement automatique du langage et la linguistique computationnelle : « le corpus annoté manuellement est ensuite utilisé par des modèles d'apprentissage supervisés pour filtrer les messages urgents des non urgents, puis déterminer les intentions exprimées dans les messages urgents (comme les appels à l'aide, aux dons, etc.). La réalisation de ces modèles d'apprentissage nécessite une synergie forte entre l’analyse sémantique formelle profonde des signaux d’intentions et un algorithme de traitement automatique des langues. »
Un projet pionnier et des défis scientifiques
« Nous disposons désormais d’un prototype qui tourne et qui est accessible en ligne pour les utilisateurs et utilisatrices, précise Farah Benamara. Avec ce démonstrateur, on peut classer les tweets selon le niveau d'urgence, selon la pertinence et l’utilité de l’information ou selon le niveau des dégâts constatés. Actuellement nous poursuivons nos recherches. Le projet Intact est lauréat pour la période 2022-2024 du programme de prématuration du CNRS, qui vise à détecter et à soutenir les projets de recherche porteurs des innovations les plus prometteuses »
À terme, cet outil de détection de l’engagement et prédiction de l’action pour la gestion de crises fera l’objet d’un transfert de technologies. « Il est encore trop tôt pour se projeter réellement dans la création d’une entreprise, reconnaît Alda Mari, mais il est clair que la plateforme sera utile à une large variété d’acteurs concernés par la gestion des crises : les collectivités, les banques, les assurances, les acteurs de l’énergie ou de l’agriculture. » Avant la mise sur le marché, l’exploitation commerciale de la plateforme ou même la définition des modèles économiques propres à valoriser les projets de recherche, les deux chercheuses ont encore face à elles un certain nombre de défis théoriques et scientifiques.
Pour Alda Mari, « côté linguistique il nous faut repérer les signaux langagiers qui expriment l'urgence - concept très abstrait - y compris quand on ne dit pas clairement que c’est urgent. Dans la vie réelle, quand c’est urgent on crie, mais sur Twitter quelle trace écrite de l’urgence transmet-on ? C’est notre défi principal. » Côté informatique, explique Farah Benamara « notre défi est de définir des modèles d’intelligence artificielle adaptés aux données et qui conservent des performances acceptables quand on les fait tourner sur des crises différentes. La plateforme doit en effet être capable de délivrer des informations pertinentes qu’il s’agisse d’une crise écologique ou d’une crise liée à un attentat.
Nous nous attachons maintenant à renforcer les prototypes et élargir le spectre des crises. Le premier appel à projet se concentrait sur une crise liée à des inondations ; le deuxième se base sur les messages émis sur les réseaux sociaux lors de l’incendie de Notre-Dame de Paris. »
Les deux équipes toulousaines et parisiennes cherchent désormais à voir ce qu’il se passe lors d’autres crises soudaines quand il y a un pic d’activité sur les réseaux sociaux.
Emmanuelle Durand-Rodriguez
Journaliste
Références
- E. Laurenti, N. Bourgon, F. Benamara, A. Mari, and V. Moriceau. Speech acts and Communicative Intentions for Urgency Detection. In the 11th Joint Conference on Lexical and Computational Semantics. *Sem2022, Association of Computational Linguistics, 2022
- E. Laurenti, N. Bourgon, F. Benamara, A. Mari, V. Moriceau and C. Courgon. Give me your Intentions, I’ll Predict your Actions: A Two-level Classification of Speech Acts for Crisis Management in Social Media. In the 13th Language Resources and Evaluation Conference. (LREC), 2022
- N. Bourgon, F. Benamara, A. Mari, V. Moriceau and G. Chevalier, L. Leygue. Are Sudden Crises Making me Collapse? Measuring Transfer Learning Performances on Urgency Detection. In Proceedings of the 19th International Conference on Information Systems for Crisis Response and Management (Work in progress paper), 2022
- Diego Kozlowski, Elisa Lannelongue, Frédéric Saudemont, Farah Benamara, Alda Mari, Véronique Moriceau, Abdelmoumene Boumadane. A three-level classification of French tweets in ecological crises. Inf. Process. Manag. 57(5): 102284 (2020) : https://www.sciencedirect.com/science/article/pii/S0306457320300650?via%3Dihub