Méthode de détection des comportements anormaux sur la base de l’analyse des relations
dans une structure multidimensionnelle
Méthode proposée
De nos jours, les réseaux sociaux se multiplient et sont parfois difficiles à gérer. Le même utilisateur peut avoir plusieurs comptes sur différents réseaux sociaux. Cependant, la synchronisation entre ces différents comptes est nécessaire. Méthode proposée 106 Par exemple, la synchronisation permet à l’utilisateur de publier une photo simultanément via Instagram et Facebook en un clic. A notre connaissance, seuls les travaux [27][120] ont été effectués dans le domaine de la détection des anomalies dans des réseaux multidimensionnels.
Notation
Dans notre méthode, nous nous inspirons de la notation utilisée dans [10] pour modéliser la structure d’un graphe multidimensionnel. Un graphe multiple non orienté G est défini par le triplet (V, E, D) où V est l’ensemble des nœuds, E est l’ensemble d’arêtes et D est l’ensemble de dimensions. Un arc e ∈ E est un triplet (u, v, d) où u, v ∈ V et d ∈ D = {Twitter, Facebook, Instagram, … }. Le triplet (u, v, d) spécifie que les nœuds u et v sont connectés par un arc e qui appartient à la dimension
Les propriétés locales du graphe social doivent être déterminées afin de nous aider à détecter les nœuds atypiques. Ces propriétés désignent un seul nœud par un ego et son voisinage à un premier niveau par un egonet. Notre méthode fonctionne en trois phases : (1) la détection des communautés dans les différentes dimensions du graphe, (2) l’estimation d’un score total d’anomalie pour chaque nœud sur toutes les dimensions et (3) la classification automatique des scores estimés pour identifier le type du comportement de chaque noeud.
Détection des communautés dans les différentes dimensions
La détection de communautés a pour objectif de regrouper les nœuds du graphe en groupes partageant des caractéristiques communes. Cette disposition est vraie dans le contexte des réseaux sociaux en ligne [125]. Les utilisateurs des réseaux Méthode proposée 107 sociaux se comportent de manière à former des communautés en fonction de leurs préférences et de leurs intérêts communs.
Diverses techniques ont été présentées dans divers travaux pour résoudre ce problème général. Un travail intéressant [9] a montré que la contribution de détection de communautés apparaît dans l’utilité des informations extraites de la structure des communautés formées. Ces informations facilitent l’analyse du comportement d’un utilisateur et permettent l’identification d’un comportement anormal. Dans [24], les auteurs ont défini qu’un egonet(u) forme une communauté avec un egonet(v) si au moins la moitié des nœuds du plus petit egonet se connectent à l’autre egonet. L’application de l’équation 6.1 [9] permet de calculer les communautés d’un graphe.
Estimation du score d’anomalie total
Dans cette section, nous développons une nouvelle formule d’estimation d’un score d’anomalie total compris entre 0 et 1 pour chaque nœud du réseau multidimensionnel afin qu’il nous aide à prendre la bonne décision concernant la nature du comportement de l’utilisateur. Tout d’abord, nous calculons le score d’anomalie AS(u) de chaque nœud dans chaque dimension di . Ensuite, nous calculons deux autres scores DE(u) et nbct(u) afin de spécifier l’influence du nœud u sur les nœuds appartenant à sa communauté. Enfin, un score total d’anomalie AST(u) est estimé. — Etape 1 : Nous commençons par calculer le score d’anomalie de chaque nœud dans chaque dimension existante dans notre réseau multidimensionnel. Le nœud peut avoir un score de : 0, 1 ou 0,5. Ce score est attribué en fonction de l’influence du nœud sur sa communauté (voir l’équation 6.4).