Point de vue métamimétique sur quelques problèmes classiques de modélisation
Un principe d’endogénéisation des distributions des paramètres propres
L’exemple des constantes de temps Nous avons jusqu’à maintenant présenté le formalisme métamimétique comme un moyen de rendre endogène une distribution de règles d’imitation. Cependant, nous avons introduit au cours de notre exposé, des variables que nous avons fixées arbitrairement, comme par exemple, les fréquences de mise à jour des règles (III.2.B.b) ou le taux d’actualisation sur les gains (III.C.c.ii). Ces variables peuvent bien entendu être rendues endogènes par des mécanismes autres que mimétiques. Nous allons montrer ici que le formalisme mimétique est autonome dans le sens où il n’y a pas de variable propre73 aux agents qui ne puisse être rendue endogène si nécessaire. La démonstration est très simple et tient en deux lignes : si cette variable fait partie de la description d’un trait modifiable elle peut être mise à jour de la même manière que ce trait modifiable, par exemple par imitation. Pour illustrer ce principe, nous allons concrètement le mettre en oeuvre dans l’endogénéisation des temps de mise à jour des agents. Il est assez logique d’associer ces temps de mise à jour à la règle elle-même. La mise à jour a généralement un coût car elle demande une collecte d’informations auprès des voisins, qui aboutit parfois à une expérience contraire aux attentes de l’agent. Ainsi, si vous demandez à quelqu’un de vous dire comment il fait pour toujours avoir le meilleur pain à sa table, celui-ci pourra vous dire qu’il essaie tous les mois une nouvelle boulangerie et choisit la meilleure parmi celles connues ou au contraire, qu’il va toujours à la même boulangerie et qu’avec le temps, il est devenu un habitué de la maison auquel on donne toujours le pain le plus frais. Si vous voulez vous inspirer de ses conseils, vous utiliserez plus ou moins les mêmes constantes de temps. Rappelons brièvement la description des agents que nous avons considérés. Ceux-ci ont deux traits modifiables : leur comportement et leur métarègle. Si en se comparant avec eurs voisins, ils constatent que l’un d’eux a plus de succès qu’eux selon leurs critères, ceux-ci attribuent cette différence avec une probabilité α à leur métarègle et avec une probabilité θ à leur comportement. Jusqu’à présent, nous avons fixé α=1 et θ=1 ce qui correspondait à une mise à jour parallèle synchrone des agents. La manière la plus naturelle de ne pas avoir à fixer ces deux paramètres est de considérer qu’ils font partie de la description de la règle : l’agent copie également les valeurs α et θ avec une précision donnée. La Figure 64 montre l’évolution des temps de mise à jour dans un dilemme du prisonnier tel que celui considéré au III.2.B.b.i. Les agents sont initialisés avec des fréquences de mise à jour égales à 0.5, puis celles-ci évoluent en fonction des erreurs de copie (cf. algorithme en annexes). Nous voyons ainsi apparaître des structures au niveau des temps de mise à jour, certaines sous populations se remettant en cause plus souvent que d’autres. Nous avons alors une mise à jour parallèle asynchrone hétérogène des agents. Comme on peut le constater, cela n’a pas d’impact sur la dynamique métamimétique, qui a exactement les mêmes caractéristiques que dans le cas d’une mise à jour parallèle synchrone.
Modéliser la co-évolution gènes-culture
Nous nous sommes libérés jusqu’à présent de toute pression de sélection pour aborder le problème de la détermination des motivations individuelles. Cette position était justifiée par deux arguments. D’une part, la comparaison entre les échelles de temps de l’évolution culturelle et de l’évolution biologique : à l’échelle de l’évolution culturelle, toutes les caractéristiques génétiques des individus peuvent être considérées comme constantes, le génome n’ayant alors pas grand-chose à faire avec les caractéristiques de l’évolution culturelle ; pour étudier les systèmes sociaux actuels, il n’est donc pas nécessaire de faire intervenir une composante génétique qui viendrait favoriser certains types plutôt que d’autres. D’autre part, les comportements sociaux dans leur grande majorité, ne relèvent pas d’un problème de maintien d’un niveau de viabilité, mais sont des choix purement culturels. Cependant, la question de contraintes externes sur la faisabilité ou la viabilité de certaines actions est tout à fait légitime dans certaines situations (en cas d’épidémie d’une maladie mortelle, chacun est libre de se prémunir ou pas, mais ceux qui ne le font pas ne resteront pas très longtemps des modèles potentiels pour d’autres individus). Si nous regardons à l’échelle de temps de l’évolution biologique, la question se pose également de la co-évolution des gènes et de la culture. D’autre part, si l’on devait admettre une définition de la coopération se traduisant par un coût en termes de fitness pour l’individu, il faudrait également montrer en quoi une société métamimétique arrive à maintenir un taux de coopération élevé. Il est donc indispensable, pour que les systèmes métamimétiques soient une option envisageable dans le cadre du paradigme darwinien, de tester la résistance des phénomènes que nous avons observés à la présence d’une pression de sélection. Ceci est bien entendu un programme de recherche à part entière, nous ne présenterons ici que les tout premiers pas dans cette direction en gardant comme exemple de base le dilemme du prisonnier métamimétique que nous avons étudié. La grande majorité des études sur l’émergence de coopération se place effectivement dans un cadre darwinien, dont la dynamique sous-jacente est la dynamique des réplicateurs (Hofbauer et Sigmund 1988). Nous en avons déjà vu un exemple dans la partie I (cf. encart n°4) avec le modèle de Henrich et Richerson (1998*). Rappelons que ce genre de jeu consiste à définir un ensemble de stratégies, une stratégie étant associée à un agent pour toute sa vie, puis à renouveler la population au cours du jeu, en indexant la proportion des différents types 263 Chavalarias D., Métadynamiques en Cognition Sociale de stratégies dans la nouvelle génération sur le gain moyen et les proportions de ces types de stratégies dans la population courante. Ceci ne veut pas dire que les agents ont le même comportement pendant toute leur vie, leur comportement pouvant évoluer en fonction de leur stratégie. Ainsi, on distingue le génotype, qui est la stratégie et le comportement que les agents ont à la naissance, du phénotype, qui est la stratégie et le comportement que les agents sont amenés à adopter au cours de leur vie. III.3.B.a Dynamique métamimétique et dynamique des réplicateurs Dans le cas des jeux spatiaux, une des manières de traduire la dynamique des réplicateurs est de décider qu’à chaque pas de temps, un agent à une probabilité de 1/T de mourir, puis de considérer que lorsqu’un agent meurt, il est remplacé par un nouvel agent dont la stratégie est héritée de l’un de ses voisins avec une probabilité proportionnelle à sa fitness. Celle-ci peut par exemple être définie comme la somme des gains d’un agent sur toute sa vie. Une variante de ce type de sélection, sans recouvrement générationnel, est étudiée par exemple dans Nowak et al (1993*, 1994a) (voir également Nowak et Sigmund 2000* pour une revue des différents modèles). En particulier, ils y montrent que cette règle est beaucoup moins favorable à la coopération et à l’émergence de structures que la règle maxi (dans le cas particulier bien entendu de la matrice qu’ils ont considérée, étant donné que la matrice du dilemme du prisonnier exclut généralement de telles structures). Pour étendre le dilemme du prisonnier métamimétique dans un cadre darwinien, il nous faut définir un ensemble de génotypes et un ensemble de comportements possibles à partir de ces génotypes. Nous garderons ici la structure simple d’agent sans mémoire à deux niveaux que nous avons considérée jusqu’à maintenant (borne cognitive égale à 1). L’extension naturelle est de considérer que chaque agent est caractérisé par deux gènes qui déterminent la métarègle et le comportement de l’agent à la naissance, cette métarègle et ce comportement étant par la suite libres d’évoluer sous la dynamique métamimétique. Nous désignerons donc un agent par quatre variables : son comportement et sa métarègle à la naissance, son comportement et sa métarègle courants. Nous aurons ainsi pour un agent i, i=(D,Maxi,C,Conformiste). Nous garderons les quatre métarègles précédentes, ce qui nous donnera quatre allèles différents, auquels nous ajouterons un allèle que nous appellerons «transmission culturelle». Un agent naissant avec cet allèle héritera alors de la règle et du comportement courant de son géniteur (c’est-à-dire ceux que celui-ci a acquis au cours de ses 264 Chavalarias D., Métadynamiques en Cognition Sociale interactions sociales) et non de la règle et du comportement que son géniteur avait à la naissance. Dans ce modèle, les processus de sélection agissent sur des conditions initiales de trajectoires. En ce qui concerne les comportements, nous garderons les deux stratégies sans mémoire C et D. Le génotype sera alors un trait non modifiable de l’agent et nous considérerons également qu’il ne fait pas partie des traits perçus. Pour une période donnée, nous parlerons du niveau génétique lorsqu’il s’agira de l’ensemble des règles et des comportements que les agents ont hérités de leurs parents, et du niveau culturel lorsqu’il s’agira des métarègles ou des comportements utilisés par les agents à la période considérée. Le problème ainsi posé, les questions intéressantes sont les suivantes : – Quelle différence y a-t-il entre des populations d’agents métamimétiques et des populations d’agents classiques ? – Comment varient la proportion des règles et le taux de coopération dans la population en fonction de la force de la pression de sélection, c’est-à-dire du temps moyen de vie T ? – Comment co-évoluent les dynamiques culturelles (métamimétique) et génétique ? Les buts n’étant pas ici de faire une étude exhaustive mais simplement de donner un aperçu de l’apport potentiel de ce type de modèle à la question de l’émergence de coopération, nous avons pris pour conditions initiales celles qui sont les moins favorables à l’émergence de la coopération c’est-à-dire une population d’agents maxi défecteurs au niveau du génotype. Cela signifie que les agents vont tous commencer par jouer D et vont revoir leurs comportements suivant la règle maxi. Le bruit sur les actions est fixé à 1 % et le bruit sur les règles à 5 %. Le taux de mutation dans le génome est égal à 10-3 : avec une probabilité égale à 10-3 , un agent hérite d’un génotype choisi parmi les 10 génotypes possibles. Les paramètres de la matrice du prisonnier sont : T=5, R=3, P=1, S=0. Enfin, les constantes de temps de mise à jour sont égales à 1 pour les règles et pour les actions.