L’analyse des réseaux

L’analyse des réseaux

Un réseau est un ensemble de points rattachés entre eux par des liens. Une carte routière, un organigramme d’entreprise ou encore un arbre généalogique constituent des réseaux, pierre angulaire des travaux qui seront présentés dans la suite. Objets d’études en informatique, et plus précisément en théorie des graphes, ils sont un outil de modélisation utilisé par de nombreuses disciplines de sciences appliquées. En sociologie, le succès des réseaux, aussi bien dans la recherche que dans un certain imaginaire collectif, leur a valu de prêter leur nom aux plateformes de mise en relation de personnes via internet, telle Facebook, une des plus célèbres, dont les données qui sont étudiées ici sont issues. Formellement, un réseau (ou un graphe) est donc formé par un ensemble de points qu’on appelle des nœuds, qui sont reliés les uns aux autres par des liens. Deux nœuds ainsi reliés entre eux sont appelés des voisins ou sont dits voisins l’un de l’autre. Les réseaux sont extrêmement utiles car ils permettent de modéliser de nombreux objets ou situations qui décrivent des relations entre des éléments. Une liste non exhaustive d’exemples de telles situations sera décrite dans la section 1.3.3. Avant de poursuivre, il est à noter qu’un réseau est souvent confondu avec sa visualisation, alors qu’en pratique un réseau est généralement défini comme un ensemble de relations, par exemple [a–b a–c a–d b–c d–e]. Dans ce cas, le réseau est composé de 5 sommets, aux noms de a, b, c, d et e. a est relié à b, c et d, b est également relié à c et d et e sont voisins. C’est seulement à partir de cette description qu’un algorithme dit de visualisation (il en existe d’ailleurs une grande variété, voir [Battista et al., 1998] pour une large présentation de ceux-ci) permet de dessiner le réseau. La forme dessinée dépend donc autant de l’algorithme choisi que du réseau lui-même, comme l’illustre la Figure 1.1 et dont les choix ont été explorés par [Henry, 2008]. On conjugue en général la visualisation d’un réseau, utile à l’interprétation par l’œil humain et à l’émission d’hypothèses, avec sa représentation structurale qui permet sa manipulation par des ordinateurs, de manière plus rapide et précise que le dessin. a b c d e a b c d e b a c d e Figure 1.1 – Plusieurs visualisations possibles et toutes structuralement équivalentes du réseau [a–b a–c a–d b–c d–e]. La Figure 1.2 présente ainsi une visualisation du réseau du métro parisien calculée par l’algorithme Force Atlas 2. Les stations y sont positionnées de telle manière que celles qui sont connectées entre elles sont rapprochées l’une de l’autre. Dans un réseau géographiquement contraint, comme celui-ci, on obtient un plan qui semble à peu de choses près calqué sur celui de Paris, bien que l’algorithme de visualisation utilisé ne connaisse pas la notion de points cardinaux ni la longueur des tunnels entre deux stations. Un réseau des lignes aériennes, par exemple, serait certainement moins proche de la réalité, puisqu’un aéroport connecté aux quatre coins du monde peut très bien être géographiquement proche d’un aéroport régional, sans pour autant être relié à ce dernier.

L’ANALYSE DES RESEAUX – EXEMPLE DU METRO PARISIEN

Un exemple tiré du réseau du métro va servir de dernière remarque pour souligner la différence entre structure du réseau et visualisation. En haut de la carte, la station Marcadet-Poissonniers est reliée à deux branches de deux stations chacune qui partent vers le nord. L’une des deux correspond à la ligne 12 du métro (ce plan est issu de données anciennes et la ligne a depuis été prolongée) et l’autre à la ligne 4. Ici l’algorithme a choisi aléatoirement quelle serait la ligne qui serait dessinée la plus à droite de la figure et laquelle serait à gauche, sans savoir ce qu’il en est en réalité. En l’absence de l’affichage du nom des stations, il est alors impossible de déterminer si la réalité a été respectée. Concorde Reuilly Diderot Place de Clichy Michel Ange Molitor Duroc Champs Élysées, Clémenceau Bercy Place d’Italie Gare du Nord Châtelet Madeleine Bastille Gare de l’Est Charles de Gaulle, Étoile Saint-Lazare Pyramides Montparnasse Nation Gare de Lyon République La Motte Picquet, Grenelle Invalides Opéra Jaurès Stalingrad Marcadet-Poissonniers Figure 1.2 – Un réseau représentant les stations du métro parisien. Le réseau, comme les autres présentés dans ce manuscrit, est exporté depuis le logiciel de visualisation et de manipulation de graphes Gephi. La similitude entre le réseau du métro et le positionnement effectif des stations illustre néanmoins en partie l’intérêt porté aux réseaux : une connaissance peu élaborée d’un système éventuellement complexe, soit simplement la liste des connexions deux à deux qui le composent permet la construction d’un objet dont l’étude peut mener à une interprétation fidèle à la réalité. Au delà de leur visualisation, les réseaux permettent en effet de mener des analyses mathématiques au travers des outils proposés par la théorie des graphes évoquée plus en détail en section 1.3.1, graphe étant le nom de l’objet mathématique représentant la structure du réseau. Cette théorie, portée par des mathématiciens ou des informaticiens spécialisés, ainsi que par des chercheurs issus d’autres disciplines variées et ayant utilisé les réseaux pour leurs recherches, a favorisé l’émergence de mesures permettant l’identification automatisée de la forme du réseau, de la centralité de chacun de ses nœuds ou encore de l’importance des liens, pour ne citer que quelques exemples. Dans le cas du plan du métro, par exemple, pour décider de la taille de chacun des nœuds, j’ai utilisé le nombre de liens qui leur sont adjacents, soit leur nombre de voisins. Cette mesure du nombre de voisins, qu’on appelle le degré, vaut 1 pour la plupart des terminus, généralement seulement reliés à la station qui les précède sur la ligne, et qui sont donc les plus petits du dessin. Les stations qui ne sont pas des terminus mais qui n’ont pas de correspondance ont un degré de 2, car elles sont reliées à une station de chaque cˆoté. A l’inverse, les stations par lesquelles passent le plus de lignes de ` métro, comme Chˆatelet, République ou Montparnasse ont un degré plus important et apparaissent en gros sur la carte. De manière analogue, la couleur des nœuds a été choisie en fonction de leur centralité. S’il existe de nombreuses définitions de la centralité qui seront évoquées dans la section 1.3.1, c’est ici la centralité dite d’intermédiarité que j’ai choisi d’utiliser. Le score de centralité d’intermédiarité d’une station est proportionnel au nombre de trajets pour lesquels elle se trouve sur le chemin (la succession de liens entre un point et un autre) le plus court. Plus un nœud est vert foncé et plus la station qu’il représente est centrale au sens de l’intermédiarité. Les stations les plus centrales du réseau parisien sont Chˆatelet, Madeleine et Gare de Lyon. Au contraire, aucun plus court chemin ne passe par les stations en bout de ligne qui sont donc les plus claires. Munis simplement de ces deux métriques, on peut déjà remarquer plusieurs catégories de stations. Faible degré Fort degré Centralité faible La majorité Michel-Ange Molitor, Stalingrad, Jaurès, Charles de Gaulle Etoile, ´ … Centralité forte Madeleine, Gare de Lyon, … Chˆatelet, République, Montparnasse, …Cette classification succincte suggère d’ores et déjà des similitudes entre les stations de mêmes catégories. Par exemple, les stations peu centrales mais à degré important sont des stations périphériques qui offrent des correspondances entre des lignes circulaires et des lignes reliant le centre de la capitale aux stations extérieures. Les stations à faible degré mais centrales sont situées entre des stations qui sont elles-mêmes plutˆot centrales et à degrés importants et profitent ainsi en quelque sorte de l’importance de celles-ci puisqu’elles permettent de les atteindre. Loin d’être exhaustive, cette présentation du potentiel offert par la science des réseaux et la théorie des graphes est en un avant-goˆut de ce que nous allons aborder au long de cette thèse en appliquant, cette fois, ce genre de méthodes d’analyse aux réseaux sociaux.

Le réseau social

Si les réseaux servent à la représentation, visuelle et mathématique, de toutes sortes d’objets, comme un plan de métro, c’est sur les relations sociales que se penche ce travail de doctorat. Polysémique, le terme de réseau social désigne en sociologie des réseaux un réseau dont les nœuds sont des individus ou des organisations qui sont reliés selon des critères de connaissance, de relations d’échanges, … L’étude du réseau social vise à analyse comment le positionnement structurel des agents en son sein permet d’interpréter leur influence dans l’environnement observé. Dans cette section, je vais présenter un réseau social et mettre en avant quelques notions et quelques questions autour desquelles repose ce travail. La figure 1.3 propose donc une visualisation du réseau social. Chaque nœud représente un individu et deux nœuds sont reliés entre eux si les deux personnes qu’ils représentent se connaissent entre elles. Comment a-t-on construit ce réseau ? Toutes les personnes qui y figurent sont en fait les amis Facebook, le terme utilisé par la plate-forme pour désigner les contacts, d’un répondant à l’enquête Algopol, à laquelle j’ai collaboré au cours de mon doctorat. Cette personne est une jeune femme de 25 ans qui vivait dans les Yvelines au moment de l’enquête. Elle n’apparaˆıt pas dans le réseau qui est pourtant celui formé par ses relations car le nœud qui la représenterait serait alors relié à tous les autres. Il n’apporterait aucune information supplémentaire et écraserait le reste par son omniprésence. On appelle réseau personnel ou bien réseau égocentré un tel réseau, composé par les contacts d’une personne. On reviendra plus en détail sur cette notion dans la section 1.4.3. Dans le reste du manuscrit, pour chaque réseau personnel qu’on rencontrera et selon les termes usuels, j’appellerai ainsi ego l’enquêté auquel il appartient, tandis que les individus qui le composent seront nommés les alters. Comme on peut l’observer, l’organisation de ce réseau est bien différente de celle du métro parisien : il possède plusieurs groupes de nœuds très interconnectés entre eux. Ces groupes, assez différents les uns des autres, sont reliés entre eux par quelques individus tandis que le réseau précédent présentait une structure d’ensemble nettement plus homogène. La forme des réseaux est en fait très dépendante de leur nature, géographique, sociale, trophique, …, et on verra d’ailleurs dans les sections 4.4 et 4.6.3 que des méthodes permettent de déterminer la discipline dont est issu un réseau à partir des caractéristiques structurales de celui-ci. Ici, les couleurs des nœuds représentent les communautés d’individus, les nœuds d’une même couleur appartenant à la même communauté. Ces dernières ont été calculées par un algorithme dit de détection de communautés en regroupant les nœuds qui sont plus connectés ensemble qu’avec les autres, ce ne sont donc a priori pas des communautés connues ou observées mais bien détectées structuralement. Selon les critères de l’algorithme, le réseau est composé de huit communautés. On repère de visu deux groupes principaux d’individus : — le premier, en bas à droite est très dense, composé de trois communautés ; — en haut à gauche, le second groupe important (en gris foncé) est moins dense, et on observe qu’un de ses alters semble être ami avec la majorité des membres de la communauté. Un petit groupe d’alters, en bleu, opère la jonction entre ces deux groupes principaux. Le fait que le groupe très dense à droite soit découpé en trois sous-communautés distinctes semble contre-intuitif car on aurait probablement imaginé qu’il forme une unique communauté. En fait, on sait grˆace aux questions auxquelles a répondu l’enquêté qu’il correspond aux étudiants et enseignants des trois classes de son établissement d’études : de nombreux élèves ont des liens avec d’autres classes mais la majorité de leurs connaissances sont dans la même classe qu’eux. De plus, les professeurs intégrés au groupe créent encore plus de liens entre les élèves des différentes classes. Si les réseaux personnels nous apprennent peu concernant les alters, ceux-ci étant vus au prisme restreint de leur relation commune avec égo, ils offrent néanmoins, comme on le verra dans la suite, une grille de lecture pertinente de la sociabilité de ce dernier. Comment alors interpréter ce réseau ? Et est-il possible d’imaginer quels sont les amis proches d’ego à partir de son observation ? On imagine souvent que plus on a d’amis ou de relations en commun avec une personne et plus il y a de chance que cette personne soit importante pour nous. Ce réseau suggère le contraire : les alters issus de la communauté estudiantine sont bien ceux qui ont les plus importants degrés (le nombre de liens avec d’autres alters, et donc le nombre d’amis communs avec égo, l’enquêté) mais il semble aussi peu probable qu’ego ait de fort liens interpersonnels avec autant d’individus et la forte interconnexion serait alors plus probablement la cause d’un effet structurant des écoles.