Techniques d’analyse des réseaux sociaux

 Techniques d’analyse des réseaux sociaux

Types de données

Dans [37], 270 fonctionnalités ont été identifiées pour décrire le comportement d’un individu, la plupart d’entre elles étant des fonctionnalités des médias so ciaux. Nous nous sommes inspirés de cet ensemble de fonctionnalités pour trou ver le moyen de les classifier en trois catégories selon leurs types, à savoir : les fonctionnalités textuelles, les fonctionnalités regroupant l’ensemble d’images et les fonctionnalités numériques.

Données textuelles

Les données textuelles sont principalement constituées de caractères appar tenant à une langue spécifique et pouvant être lus par un être humain. Il s’agit principalement des publications, des commentaires, des biographies ou des légendes accompagnants des images. Il existe de nombreuses approches pour l’analyse de texte, principalement les techniques du Text Mining (TM) et du Natural Lan guage Processing (NLP). Dans ce qui suit, nous présenterons ces deux techniques en expliquant l’importance de l’une par rapport à l’autre suite à notre objectif. 

Analyse textuelle

Text Mining est le processus d’extraction d’informations de haute qualité à partir de données textuelles, l’information pouvant être des motifs ou des structures correspondantes dans le texte sans tenir compte de la sémantique de celui-ci. Il en résulte principalement des informations statistiques telles que la fréquence et la corrélation des mots [79].

Natural Language Processing est le processus qui permet à l’ordinateur de comprendre le langage parlé par les humains, ainsi que la sémantique et les sentiments qu’il transmet, en effectuant des analyses telles que l’analyse lexicale, syntaxique et sémantique [79].

Dans le domaine de détection des comportements atypiques, il est nécessaire d’extraire le contexte de l’analyse. Nous souhaitons savoir ce que l’utilisateur tente d’inciter avec ses publications et leur degré d’influence sur les autres utilisateurs du réseau. Par conséquent, nous devons passer par l’analyse sémantique et ne pas travailler avec les mots en tant qu’objets.

Ainsi, le traitement automatique du langage naturel (NLP) semble être la technique la plus appropriée à notre besoin. Le NLP est une branche multidisciplinaire qui combine des connaissances de 41 Types de données l’informatique, de la linguistique et de l’intelligence artificielle.

Appelé également Traitement Automatique du Langage Naturel ou ingénierie linguistique, il vise principalement à analyser, traiter et reproduire le langage humain de manière automatique. Pour ce faire, il utilise des algorithmes spécifiques du Machine Lear ning (ML) et du DL. Grâce aux techniques du NLP, les machines peuvent inter préter et reproduire efficacement le langage parlé. Les différentes phases de NLP sont l’analyse morphologique, l’analyse syntaxique et l’analyse sémantique.

Analyse morphologique

Le traitement de la morphologie consiste à analyser la structure des mots. Nous étudions leur construction à partir d’unités significatives primitives appelées mor phèmes. Cela nous aidera à diviser les différents mots/phrases d’un document en jetons qui seront utilisé lors d’une analyse ultérieure

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *