La dynamique de la prise de décision

La dynamique de la prise de décision

“¿Debe ser bonito tomar tus proprias decisiones verdad? – A mí cada vez me queda más claro, brujita, que, pues, que lo único que tenemos son las decisiones que tomamos.23” Épisode 4, Saison 2, Narcos Mexico Nous avons amplement étudié les processus liés à l’évaluation autant pour ce qui est des récompenses que des dévaluateurs de celle-ci comme l’incertitude, le délai, l’effort physique, l’effort mental et les punitions. Nous avons aussi vu comment les différents dévaluateurs pouvaient impacter l’évaluation des récompenses au niveau comportemental, comme cérébral. En effet, nous avons pu identifier un réseau de zones cérébrales liées à l’évaluation qui comprend pour membres principaux le cortex préfrontal ventromédian et le striatum ventral, et dont l’activité augmente avec la valeur anticipée des récompenses et décroît avec les dévaluateurs qui peuvent y être associés. De plus, nous avons pu étudier un autre réseau de zones cérébrales liées à l’identification de stimuli aversifs qui y réagissait comme pour amener le reste du cerveau à mettre en place un plan d’action pour réagir à ces stimuli aversifs. À présent, nous allons étudier plus précisément les processus dynamiques qui mènent à la prise de décision. Pour ce faire, nous allons d’abord étudier les différents modèles de prise de décision qui ont pu être proposés ces dernières décennies. Ensuite, nous allons nous pencher sur les modèles dynamiques de la prise de décision dans le cas des choix binaires.

Décomposer la motivation

Étapes de la motivation « une fois qu’on a posé la fin, on regarde la question de savoir comment et par quels moyens on peut l’atteindre et si plusieurs moyens paraissent en mesure de l’atteindre, on examine quel est le plus facile et le plus beau. » « – Ça doit être bon de prendre ses propres décisions. – Il devient de plus en plus clair pour moi que nous n’avons rien d’autre que nos décisions. » La dynamique de la prise de décision Introduction 114 Dans la vision de Kent Berridge et de Morten Kringelbach que nous avons déjà évoqué, on peut décomposer le comportement motivationnel en 3 étapes (Berridge et al., 2009; Georgiadis and Kringelbach, 2012): 1) le désir (wanting) où le sujet désire quelque chose et est incité à l’obtenir par différentes zones cérébrales, dont le striatum ventral, qui le poussent à agir pour satisfaire ce désir ; 2) la consommation et l’appréciation de l’objet du désir (liking) où le sujet ressent du plaisir pour avoir obtenu ce qu’il désirait ; 3) la satiété et l’apprentissage (learning) où le sujet ne désire plus le but qu’il recherchait mais par contre il apprend puisqu’il peut réévaluer la valeur du but qu’il désirait en fonction de l’intensité du plaisir ressenti pendant la consommation et des coûts liés aux actions nécessaires pour obtenir ce plaisir. Antonio Rangel et ses collègues vont encore plus décomposer ce processus en identifiant 5 étapes clés (voir Figure 20 et (Rangel et al., 2008)): 1) se représenter l’ensemble des actions possibles ; 2) être capable d’évaluer la valeur nette (= bénéfice espéré – coût estimé de l’action) associée à chaque action de l’ensemble identifié en (1) en fonction des états internes (ressources disponibles, faim, soif, etc.) ; 3) sélectionner, parmi l’ensemble d’actions identifiées en (1), l’action avec la valeur nette estimée en (2) la plus élevée ; 4) évaluer les conséquences de l’action effectuée (bénéfice obtenu et coût effectué) ; 5) apprendre, c’est-à-dire mettre à jour les coûts et bénéfices associés à chaque action en les comparant à ce qui était initialement attendu, via ce que l’on appelle des erreurs de prédiction, afin de raffiner sa sélection pour l’avenir. Rangel développe donc juste la première étape liée au désir du modèle de Kent Berridge et Morten Kringelbach en la décomposant en 3 sous-étapes qui permettent de prendre en compte le fait que plusieurs buts sont souvent désirés en parallèle et qu’il faut choisir parmi ces buts lesquels satisfaire en priorité. Ceci implique donc d’attribuer une valeur à chacun de ces buts pour pouvoir les évaluer sur une échelle commune et sélectionner en fonction le but à satisfaire en premier. Introduction 115 Figure 20: Différentes étapes dans les mécanismes de prise de décision d’après (Rangel et al., 2008). Peut-être que l’une des choses qui manque à ces deux modèles est d’incorporer une étape clé entre la notion de désir et la satisfaction du désir. Cette étape correspond à la mise en place d’une série d’actions mentales et/ou motrices en vue d’atteindre le but en question. La plupart des modèles développés par la suite vont considérer cette étape mais toujours de manière séparée de l’évaluation. Ils partent tous du principe que le cerveau va d’abord effectuer une évaluation des différents plans d’action puis choisir lequel est le meilleur et s’y tenir avant de produire le mouvement (Cisek, 2012). Un débat a cependant eu lieu entre différentes théories à propos de la nature de ce qui est évalué et du moment où un plan d’action est mis en place pour atteindre l’objet du désir. La théorie « fondée sur les biens » (good-based model) postule que les agents évaluent d’abord chaque offre indépendamment en prenant en compte les gains potentiels et les coûts associés à ces biens, dont les coûts de l’action. Ce serait seulement une fois qu’une décision sur quel bien désirer en priorité a été prise qu’un plan d’action serait mis en place en vue d’atteindre l’objet du désir (Cisek, 2012; Padoa-Schioppa, 2011). L’un des points principaux de cette théorie est de séparer d’un côté la représentation des biens qui serait utilisée pour l’évaluation et de l’autre Introduction 116 la représentation sensorimotrice de la série d’actions à effectuer en vue d’atteindre ces biens qui ne viendrait qu’après. Un point curieux de cette théorie est qu’elle propose que le coût des actions soit envisagé dans l’espace des biens avant d’envisager un plan d’action. En d’autres termes, le cerveau estimerait un coût approximatif des actions à effectuer avant même de savoir quelles actions il va entreprendre pour atteindre l’objet de son désir (Cisek, 2012; PadoaSchioppa, 2011). Une autre théorie propose que ce qui est comparé est directement dans le plan des actions (action-based model). Cette théorie propose que les plans d’actions liés à chaque option envisagée soient pris en compte au moment de l’évaluation (étape 2) et au moment de la sélection de la meilleure option (étape 3). Une fois la meilleure série d’action choisie, les individus la mettraient alors en route en vue d’atteindre leur objectif (Cisek, 2012; Rangel and Hare, 2010).