Imiter à dix mille les jeux spatiaux
Jeux évolutionnistes et chaos spatial
Si vous avez déjà assisté à un match de foot, ne serait-ce qu’à la télé, vous avez certainement été témoin du phénomène de hola après un but décisif : chacun lève les bras en imitant son voisin avec un petit décalage, ce qui engendre des vagues humaines dans le public. La hola est l’effet visible et macroscopique d’une diffusion de comportements d’origine imitative. Que se passe-t-il si au lieu d’assister à un match de foot, des agents imitateurs jouent à un dilemme du prisonnier ? Axelrod posa brièvement la question dans son livre The Evolution of Cooperation (1984), que Nowak et May ont repris et développé dans un article intitulé Evolutionary Games and Spatial Chaos (1992*). Ils y mettent en évidence des phénomènes de diffusion de comportements coopérateurs dans des populations d’agents mimétiques sans mémoire. Nous allons prendre ce modèle comme exemple paradigmatique de modélisation de phénomènes mimétiques. Bien que de nombreux développements aient depuis été proposés, élargissant considérablement la portée de telles études, sa simplicité va nous permettre de saisir une méthodologie et d’appréhender le type de phénomènes que ce genre de modélisation permet d’approcher. Prenons un échiquier dont les côtés comportent N cases, et faisons correspondre les bords deux à deux en les recollant. Nous obtenons ainsi une grille torique, sorte de grosse bouée quadrillée. Sur chaque case, plaçons un joueur qui interagit avec ses huit voisins dans le cadre d’un dilemme du prisonnier (cette structure est appelée voisinage de Von Neumann),chaque agent jouant également contre lui-même Dotons ces joueurs de comportements très simples. Ceux-ci sont monolithiques : à chaque séance de jeu (appelée période), un joueur oppose à tous ses voisins le même comportement, qui, pour garder les notations déjà introduites, est noté C (coopération) ou D (défection). Après chaque période, un joueur se voit donc attribuer un gain qui est la somme des gains obtenus au cours des neuf interactions deux à deux (auto-interaction incluse). Entre deux périodes, les agents ont l’opportunité de changer de comportements suivant une règle d’imitation indexée sur les gains : à la fin de chaque période, chaque joueur compare ses propres gains aux gains qu’ont obtenus ses huit voisins, puis choisit d’adopter à la période suivante le comportement qui a connu le plus de succès en terme de gains. Cela signifie que si un joueur A a obtenu le gain le plus important localement, il ne changera rien à son comportement à la période suivante. Par contre, si l’un de ses voisins a un gain strictement supérieur à tous les autres, il va l’imiter. Cette configuration de jeu correspond à la situation évoquée précédemment de provisions de biens publics avec une composante spatiale. Donnons un exemple :
– Pompage des eaux souterraines : si des agriculteurs se fournissent en eau en pompant les nappes phréatiques, l’extraction d’eau par l’un d’eux peut avoir, dans certains configurations géologiques, un impact négatif sur les réserves de ses voisins. En cas de sécheresse, la nappe phréatique risque d’être épuisée par de trop forts tirages. L’intérêt collectif serait que chacun limite sa consommation d’eau afin d’éviter l’épuisement de la nappe. D’un autre côté, l’intérêt de chacun est d’utiliser l’eau en quantité optimale pour les récoltes ou le bétail, et éventuellement de faire des réserves pour le cas où l’eau viendrait à manquer. Ce comportement risque de provoquer inévitablement l’assèchement de la nappe. Dans ce cas encore, le comportement d’un agent a un impact sur l’environnement de tous ses voisins, sans discrimination.
Nous avons vu que la modélisation d’une situation de dilemme du prisonnier nécessite l’attribution des différentes valeurs de gains. La première chose qui va nous intéresser est la dépendance des comportements collectifs par rapport à ces gains (impact de la nature des sols ou des rendements sur les comportements collectifs). La matrice du dilemme du prisonnier est déterminée par la donnée de quatre valeurs T, R, S et P, mais on montre théoriquement que ce problème se décrit d’une manière tout aussi générale avec seulement deux paramètres. Ceci fait, pour simplifier autant que possible l’étude du problème, nous pouvons chercher une paramétrisation particulière de la matrice qui couvre l’ensemble des dynamiques collectives intéressantes.
Le chaos est-il robuste ?
Dans leur article Evolutionary Games and Spatial Chaos (1992*), Nowak et May proposent le modèle du dilemme du prisonnier spatial comme métaphore pour l’étude de l’évolution et du maintien des comportements coopératifs. Contrairement aux modèles proposés auparavant, les agents qu’ils considèrent sont extrêmement simples, n’ont pas de mémoire, ne forment pas d’anticipation, et néanmoins parviennent collectivement à maintenir un niveau appréciable de coopération dans une certaine zone de paramètres (1.8<T≤2). De plus, fait remarquable, dans cette zone le taux moyen de coopération sur le long terme est indépendant des conditions initiales choisies, ce qui permet aux auteurs d’avancer l’hypothèse qu’il existerait une constante universelle définissant le taux moyen de coopération dans de tels réseaux. L’idée sous-jacente est que le caractère spatial des interactions dans ce jeu, qui est également prédominant dans la vie réelle, est un facteur qui pourrait être suffisamment fort pour expliquer l’émergence de régularités et de structures coopératives à grande échelle. Ainsi, la coopération et la structuration des groupes sociaux serait en partie expliquée par des phénomènes qui ne tiennent nullement d’une rationalité particulière, mais plutôt d’une structure d’interaction.
Pour voir si le modèle que nous venons d’étudier est une bonne illustration de cette idée, quelques vérifications sont nécessaires pour tester la robustesse des phénomènes observés vis-à-vis des conditions extérieures. Comprenons bien où se situe le débat. Une des caractéristiques de la coopération humaine est qu’elle apparaît sous un ensemble très vaste de conditions environnementales. Quelle que soit la manière dont sont modélisées les conditions environnementales (dans le cas du dilemme du prisonnier elles sont schématisées par les quatre valeurs P, R, S et T), il faut donc s’assurer que les phénomènes de coopération que l’on observe apparaissent également pour un grand nombre de conditions environnementales artificielles. A quoi servirait une explication de la coopération humaine qui ne marcherait que lorsque la température ambiante est comprise entre 20 et 22°C? Dans leur article de Nature, Nowak et May annoncent avoir testé la robustesse des phénomènes de type chaos spatial pour différents types de voisinages (interactions avec seulement quatre voisins), pour des jeux sans auto-interaction, et pour de faibles valeurs de P. Mais nous avons vu que l’exemple standard du dilemme du prisonnier correspond aux valeurs T=5, R=3, P=1 et S=0 ce qui, traduit dans les termes des auteurs, correspond à T=5/3=1.66 et P=1/3. Qu’en est-il donc, si tout en gardant P=1/3, nous examinons la dépendance de la dynamique vis-à-vis du paramètre T ? L’étude que nous avons menée aboutit aux conclusions suivantes : le type de dynamique qui précisément fait l’intérêt du modèle de Nowak et May disparaît ! Pour une valeur bien déterminée de T, la dynamique passe brutalement d’une zone où la population finale est principalement constituée de coopérateurs, à une zone ou la population finale est principalement constituée de défecteurs. De plus, la transition entre ces deux types de dynamique intervient pour une valeur très faible de T (autour de 1.1 lorsqu’il n’y a pas auto-interaction ). Nous retombons donc sur des dynamiques qui d’une part, aboutissent à des équilibres quasiment homogènes, ce qui est plutôt déplaisant étant donné les observations empiriques, et d’autre part, ne favorisent la coopération que pour des zones de paramètres correspondant à des dilemmes sociaux de très faible intensité (cf. Figure 11).
La pratique de la modélisation en sciences humaines
Nous avons pu voir au I.1.C.b que l’étude expérimentale des processus de décision des individus en situation d’interaction sociale révèle une hétérogénéité très marquée, celle-ci suggérant la coexistence, dans une même population, de différents types de règles de prises de décision. Nous allons voir à présent quelles ont été, dans la littérature de la modélisation, les différentes approches envisagées pour formaliser de manière générale cette hétérogénéité, et quels types de modèles y sont associés. En particulier, nous chercherons à savoir dans quelle mesure cette hétérogénéité est endogène au système, au sens où elle est déterminée par la dynamique interne des systèmes étudiés.
Modéliser au quotidien
« Nicole, apportez-moi mes pantoufles, et me donnez mon bonnet de nuit ».A-t-elle mal entendu ? Les pantoufles auraient-elles disparu ? Avant même d’avoir obtenu une explication, si Nicole n’apporte pas ses pantoufles à M. Jourdain, celui-ci va certainement rechercher les causes de ce manquement en établissant à partir de ses connaissances sur le monde, les raisons qui ont pu l’amener à n’apporter que le bonnet de nuit. Comme tout un chacun, si les conséquences des actions de M. Jourdain sont en désaccord avec ses attentes ou s’il s’apprête à prendre une décision, M. Jourdain utilisera un modèle du monde, constitué de tout un ensemble de faits et de relations causales, qui lui permettent au jour le jour de comprendre son environnement. Ce modèle, chacun se le construit en fonction de ses expériences, et l’affine en fonction de ses objectifs. Il nous permet de répondre d’une manière plus ou moins efficace à tout un ensemble de questions que nous nous posons sans avoir à en faire une vérification empirique. Cependant, il est certaines questions qui mettent en jeu un nombre si grand d’éléments, qu’il nous est impossible de les penser ensemble afin de déterminer l’effet de leurs interactions. Il suffit pour s’en convaincre de reprendre l’exemple de la question posée dans la partie I.2, où nous nous sommes intéressés au comportement collectif de plusieurs milliers d’agents imitateurs. C’est pour répondre à ce genre de questions que se sont développées la modélisation mathématique et la modélisation informatique.