Les ressources neurales allouées au compromis coûts bénéfices
Le dmPFC et la prise de décision
Considérons l’équation : 𝑆𝑉 = 𝑅 ∙ 𝑝 − 𝑃 ∙ (1 − 𝑝) − 𝐶 où SV est la valeur subjective, R est une récompense à obtenir, P une punition à éviter, p la probabilité de réussir, c’est-à-dire la confiance prospective, et C les coûts des actions nécessaires à atteindre le but fixé (obtenir R ou éviter P). Le dmPFC a été associé à une quantité impressionnante de concepts cognitifs très variés dont plusieurs sont en lien avec différentes parties de cette équation. Plus spécifiquement, si l’on reprend cette formule, le dmPFC a notamment été associé à : 1) l’encodage des valeurs négatives (P ou –(R-P) ) (Bartra et al., 2013; Hayes and Northoff, 2011), c’est-à-dire un encodage de la valeur associée à un stimulus qui irait dans le sens opposé au codage du réseau des valeurs (voir Un réseau appétitif et un réseau aversif) ; 2) le calcul de l’incertitude (p) (voir Les bases neurales de l’incertitude) (Christopoulos et al., 2009; Volz et al., 2005) ; 3) le calcul des coûts associés à une action (C) (Kurniawan et al., 2013; Skvortsova et al., 2014) ; 4) l’intégration dynamique du compromis coûts/bénéfices en vue d’estimer une valeur nette (SV) (Pessiglione et al., 2018; Pisauro et al., 2017) ; 5) le calcul de la valeur d’implémenter du contrôle cognitif (Shenhav et al., 2013), c’est-à-dire une méta-variable qui module le calcul de SV.
Hypothèse 1 : la valeur négative des stimuli
Nos résultats paraissent partiellement compatibles avec cette hypothèse en ce que, dans la première étude, nous avons pu voir que l’activité du dmPFC diminuait avec l’aspect appétitif des récompenses présentées dans la tâche d’évaluation (β = -0.229 ± 0.107, p = 0.038). De même, dans la troisième étude, l’activité du dmPFC diminuait avec la valeur subjective des items présentés (βVal = -0.288 ± 0.093, p = 0.005). Cependant, on ne peut pas non plus voir le dmPFC comme une zone dont l’activité serait simplement l’opposée du vmPFC puisque, comme nous l’avons vu, alors que l’activité du vmPFC décroissait avec la pénibilité des efforts (β = -0.670 ± 0.205, p = 0.002), le dmPFC affichait une tendance similaire (β = -0.225 ± 0.116, p = 0.060). Si cette hypothèse paraît donc possible, la vision selon laquelle le vmPFC et le dmPFC formeraient deux systèmes neuraux tirant chacun dans une direction opposée, paraît peu plausible, en tout cas comme un processus général qu’on pourrait retrouver dans toutes les situations.
Hypothèse 2 : l’incertitude
Nous n’avons pas pu observer de corrélation claire entre le dmPFC et notre mesure indirecte de la confiance, c’est-à-dire l’équivalent de la variable p de l’équation ci-dessus, dans notre première étude même si l’activité du dmPFC avait en effet tendance à diminuer avec p (βConf = -0.098 ± 0.089, p = 0.276). Dans notre troisième étude, l’activité du dmPFC avait aussi tendance à diminuer avec le degré de confiance (βConf = -1.767 ± 1.044, p = 0.105). Même si nos résultats suggèrent que, si effet il y a, il est relativement faible, ils ne permettent donc pas de complètement infirmer cette hypothèse.
Le dmPFC : la vigie du cerveau ?
« tous les bœufs et les chevaux et toutes les bêtes à l’envi témoignent du contraire par leur chasse à la jouissance ; le vulgaire s’y fie, comme les devins aux oiseaux, pour juger que les plaisirs sont les facteurs les plus puissants de la vie bonne, et regarde les amours des bêtes comme des témoins plus autorisés que ne sont les amours nourris aux intuitions rationnelles de la muse philosophique. » 67b, Philèbe, Platon (Platon, 2018) Depuis l’Antiquité, les philosophes considèrent qu’il existe une dualité entre les appétits animaux, autrement dit les désirs, et de l’autre un système rationnel orienté vers des buts. Les appétits animaux seraient mauvais parce qu’ils ramèneraient l’homme à la part qu’il a en commun avec la plupart des autres Mammifères, comme l’exprime Platon dans la citation cidessus via un discours de Socrate. Ces appétits amèneraient l’homme, comme dans le test du marshmallow (voir L’aversion pour le délai), à prendre des décisions sous-optimales sur le long Discussion générale 250 terme.
À l’opposé, le système rationnel serait guidé par la philosophie, la prise en compte du futur et pas seulement du besoin présent. Cette vision duelle du cerveau humain parcourt depuis longtemps la philosophie occidentale et la philosophie orientale. On en retrouve des traces au moins depuis le Vème siècle avant Jésus-Christ. On retrouve en effet aussi bien chez Platon (Vème siècle av. JC), comme dans la citation ci-dessus, ou chez Aristote (IVème siècle av. JC) (voir Bases neurales du délai) en Occident, que chez Confucius (VIème siècle av. JC) en Orient à peu près à la même période, un ensemble de réflexions promouvant le contrôle de soi plutôt que d’obéir à ses appétits. Confucius aurait dit par exemple : « Aimer à donner libre cours à ses convoitises, aimer à perdre son temps et à courir çà et là, aimer les festins et les plaisirs déshonnêtes, ces trois passions sont nuisibles. » (Confucius and Lao-Tseu, 1973).