Réseaux décisionnels cadre et résultats théoriques
Un modèle de décision causale
Reprenons le cadre formel proposé dans notre définition du risque 2 . Nous nous intéressons à présent au problème de détermination des variables Gi , i = 1, …,n dans la structure causale D, c’est-à-dire au choix d’un ensemble d’actes causalement liés. L’ensemble χ représente celui des états d’un décideur, dont chaque variable Xi mesure un aspect. Les variables Yi , dont chacune représente l’incertitude relative à la réalisation d’une variable Xi , sont désormais des fonctions mesurables définies sur un ensemble d’états du monde Ω. Pour une combinaison d’actes donnée, l’état (x1, …,xn) du décideur est entièrement déterminé dès lors qu’un élément ω de Ω survient. De ce fait, l’aspect dynamique de notre représentation repose sur une décomposition de cette survenue. Si le décideur observe directement ω, alors nous ne pouvons considérer que deux états : celui où il détermine ses choix et celui où il en découvre les conséquences ; le problème de décision est statique. Si, en revanche, il observe progressivement des aspects de ω mesurés par les variables Yi , alors il doit tenir compte des conséquences d’un acte avant d’engager le suivant, et le problème de décision est dynamique. Nous retenons cette dernière situation comme référence dans ce chapitre, et nous traitons de la décision statique comme cas particulier 3 . Nous supposons donc que toutes les variables Xi sont initialement indéterminées, et que l’incertitude se lève de façon graduelle, dictant au décideur un ordre de traitement de ses problèmes. Lorsqu’il envisage une mesure relative à Xi , le décideur a donc déjà agi sur les variables précédentes, et il en connaît les valeurs ainsi que les limites qu’elles imposent à son choix. Par ailleurs, il doit tenir compte des conséquences directes de sa décision pour Xi et de l’incertitude Naturellement, les cas où certains aspects de l’état du monde (c’est-à-dire les valeurs de certaines variables exogènes) sont observés au même moment, mais pas toutes, se traitent aussi comme des cas particuliers du problème dynamique. spécifique qui les affecte, mais aussi de ses effets sur le reste de la structure. La dynamique de l’incertitude, qui se caractérise donc par l’ordre dans lequel le décideur observe la réalisation des variables Yi , doit respecter la structure causale, de sorte que les parents soient toujours déterminés avant les enfants. Cette hypothèse est la simple traduction du principe commun selon lequel une cause doit précéder temporellement ses effets (Reichenbach, 1956; Good, 1961). Observons qu’elle n’interdit pas que le décideur doive agir sur les effets avant d’avoir connaissance des causes, ce qui constitue un simple cas de décision statique. En revanche, notre représentation ne permet pas de rendre compte de situations où le décideur observe des effets mais reste incertain au sujet de leurs causes. Ces cas relèvent de l’incertitude causale, que nous aborderons dans la dernière partie de ce chapitre. Il faut enfin noter que l’ordre 1, …,n, que nous estimons fixé dans la suite, n’est que partiellement imposé par la structure causale.
Des modèles causaux à la théorie de la décision : discussion préalable
États du monde et causes inobservables
Lorsque le décideur considère le choix d’un acte en i, la valeur xP a(i) des parents de Xi est donc déterminée. Conditionnellement à cette valeur, chaque réalisation (xi ∈ χi) se touve alors associée, pour un acte donné, à une réalisation de la variable Yi . Dans notre représentation, cette dernière est l’image d’un événement dans un espace des états savagien (Ω, A). En particulier, notre version du postulat P6 de Savage requiert que la σ-algèbre A ne comporte aucun atome (c’est-à-dire aucun événement qui ne puisse être divisé en sous-événements). Cependant, l’approche causale apporte à cette hypothèse une justification qui peut sembler plus intuitive, plus convaincante et surtout plus satisfaisante sur le plan normatif que celle proposée par Savage dans un cadre probabiliste. 4 Cette justification est fondée sur le lien entre l’ensemble Ω et la variable résiduelle Yi . Comme nous l’avons mentionné plus haut, dans une interprétation causale de la relation Xi = gi(XP a(i) , Yi), Yi représente l’agrégation de toutes les causes inobservables de Xi . Une transposition fidèle de cette relation dans notre nouveau cadre aurait la forme : Xi = gi(xP a(i) , Yi(ω)) Ω est donc l’ensemble de définition de toutes les causes inobservables de chaque Xi . Les événements en i sont dès lors subdivisibles tant que le décideur peut imaginer différentes combinaisons de causes inobservables conduisant à leur réalisation. Si l’on considère que, dans le cas général, les variables susceptibles d’exercer une influence causale sur Xi sont en nombre infini, il en résulte que l’algèbre A des événements n’a pas d’atome. En d’autres termes, rien ne permet à un décideur de décrire de façon complète un état du monde en i a priori : quel que soit le nombre de causes potentielles qu’il identifie, il peut toujours imaginer qu’un facteur supplémentaire vienne influencer la détermination de la conséquence.
Le passage aux actes
La théorie des réseaux bayésiens causaux (RBC) s’intéresse avant tout aux rapports entre variables. Les interventions y servent principalement de révélateurs de ces rapports. Ceci explique d’une part que la théorie se soit le plus souvent limitée à la classe restreinte des interventions do(Xi = xi), qui représente des décisions sans incertitude (ou, dans la terminologie de la théorie de la décision, des actes constants), et d’autre part qu’elle ne se soit guère tournée vers l’analyse dynamique qui consiste à s’interroger sur les conséquences d’une intervention pour le choix d’interventions ultérieures. En théorie de la décision, au contraire, l’acte est l’objet central, qui doit être traité de la manière la plus générale et la plus systématique possible. Pour accommoder les RBC à ce changement de perspective, nous avons commencé par étendre la notion d’intervention, en passant des interventions constantes do(Xi = xi) à toutes les fonctions reliant la valeur de Xi à l’ensemble de ses causes, comme le proposaient déjà Marschak (1950) ou Simon (1953) 5 . Pour éviter toute confusion, nous continuerons, comme au chapitre précédent, à éviter le terme d’intervention, et nous désignerons les fonctions gi du nom de mécanismes afin de marquer la distinction entre leur rôle et celui des actes. En deuxième lieu, comme esquissé au chapitre précédent, nous inversons l’usage des relations causales, en utilisant les variables pour mettre en évidence les rapports entre actes. Pour clarifier ce point, notons que tout problème de décision en i est conditionné par une valeur de xP a(i) . Ainsi, lorsqu’il considère son problème en i, le décideur trouve à sa disposition un ensemble de mécanismes gi déterminé par la valeur des parents de Xi , qui découle elle-même d’actes engagés en amont de i. Cet ensemble est en revanche indépendant de tout autre antécédent de Xi . Chacun des mécanismes gi n’est fonction que du seul état du monde ω, par le biais de la variable Yi représentant l’effet agrégé des causes inobservables de Xi .