Aide à la décision multicritère pour la prescription de scénarios d’amélioration énergétique via une approche globale
Circulation d’information
Avant de présenter les différents systèmes de modélisation du savoir, il convient de définir certains termes techniques dédiés aux différents modes d’inférence de la connaissance. Au sein d’un raisonnement logique ou graphique, il existe trois types de propagation possible de la connaissance : Le chaînage avant : Le chaînage avant est une méthode de déduction qui applique des règles d’inférence en partant des prémisses (observations, faits) pour en déduire de nouvelles conclusions.
Ces conclusions enrichissent la mémoire de travail et peuvent devenir les prémisses d’autres règles. Le chaînage arrière : Le chaînage arrière est une méthode d’inférence (inductive) permettant de partir d’un effet ou d’une solution et de tenter de remonter la chaîne afin de déterminer les causes les plus probables de cet effet (observations, faits). Ce type de propagation de l’information est notamment utilisé dans les systèmes de diagnostics automatisés. Types de raisonnement (au choix) Connaissances Préférences Décision Monocritère Multicritères Familles de modèles Gestion des incertitudes Graphique Logique Approche booléenne Approche probabiliste Aide à la décision multicritère pour la prescription de scénarios d’amélioration énergétique via une approche globale 69 Le chaînage mixte : Le chaînage mixte, ou chaînage hybride, combine les 2 chaînages précédents : il fonctionne comme le chaînage avant dans le but de déduire une solution à partir de faits donnés ; mais applique également un chaînage arrière sur chaque fait identifié afin de déterminer les paramètres les plus probables et les plus optimisés. Ce mécanisme permet l’ouverture sur de nouvelles combinaisons encore non envisagées par les règles d’inférence et de déterminer les facteurs discriminants lors de la recherche d’une solution. En fonction de la technologie de modélisation des connaissances utilisée (voir §VI.2), un ou plusieurs types d’inférence sont possibles. La plupart des technologies permet le raisonnement par chainage avant (par exemple, les arbres décisionnels, les systèmes experts).
Approches booléennes, probabilisées
La gestion des incertitudes, autant sur les connaissances (partielles, incertaines, imprécises…) que sur les relations entre ces connaissances (incertitudes dans les mécanismes de chaînage, extrapolations statistiques, fusions de données…), peut être également pris en compte dans les mécanismes d’inférence. les approches booléennes ne tiennent généralement pas compte de ces caractères incertains. Ce sont les approches les plus simples et les plus utilisées dans l’industrie ; les approches probabilistes intègrent une partie des incertitudes précédemment mentionnées. Elles sont plus souvent rencontrées dans les outils de Datamining et certains outils d’aide à la décision. Elles utilisent le plus souvent des très grosses bases de connaissances pour modéliser l’incertitude sous la forme de distributions statistiques. VI.2 Les techniques de modélisation de la connaissance Nous allons voir dans ce sous-chapitre, les principales technologies de modélisation de l’information rencontrées lors de ces recherches bibliographiques, qui permettent l’automatisation, et lorsque cela est possible l’optimisation, d’un processus décisionnel.
Modélisations arborescentes
Les modélisations arborescentes sont des représentations graphiques plus ou moins complexes de situations sous la forme d’arbres. Elles sont modélisées par des nœuds représentant des décisions intermédiaires, et des branches représentant le « chemin entre deux nœuds ». Le résultat final apparait sous forme d’extrémité d’une branche. Ce type de modélisation peut se décliner pour différents usages : arbres décisionnels (modélisation de connaissances avec pour finalité une aide à la prise de décision), arbres de causes (modélisation Bottom-Up ayant pour but de générer de la connaissance), arbres de défaillances (utilisés dans une perspective d’analyse de risques), etc. Les arbres décisionnels sont souvent utilisés dans les domaines tels que la sécurité ou la médecine. Ils sont adaptés à la représentation de systèmes statiques où le résultat final ne dépend généralement pas de l’ordre des décisions intermédiaires (Figure 17).
Systèmes experts Un Système Expert a pour finalité de reproduire le raisonnement d’un expert lors de la résolution d’un problème, en s’appuyant sur une méthodologie constituée de quatre composants : une base de connaissance (règles décisionnelles fournis par des experts), une base de faits (données récupérées lors d’un diagnostic ou d’un questionnaire), un moteur d’inférence (algorithmes permettant d’appeler les règles en fonction des faits établis pour déduire de la connaissance, et une interface homme-machine (le tout représenté dans la Figure 18). L’objectif est de codifier et d’intégrer le savoir des experts dans un outil informatique afin de rendre cette connaissance utilisable par un non spécialiste. Les règles sont des assertions données sous forme d’implications (fonctions logiques) utilisant des conditions : Exemple 1 : Si , alors Exemple 2 : Si et , alors Parmi les systèmes experts les plus connus, le système de diagnostic médical MYCIN développé dans les années 1970 fut le plus célèbre [101]. Embarquant plus de 600 règles, ce système expert permettait d’identifier le type de bactéries causant de sévères infections à un patient, dans une optique de lui prescrire les bons antibiotiques avec un dosage adapté à sa physiologie. De manière classique un système expert est constitué d’assertions causales certaines. Cette nécessité d’affirmer que telle condition entraine à coup sûr telle conclusion, empêche les experts de se prononcer, de peur de se tromper ou d’omettre des facteurs influents peu probables. Une solution est alors d’associer à chaque règle, un facteur de croyance (CF : Remplacement des fenêtres requis ? Bruits extérieurs aériens ? OUI NON Double vitrage acoustique (asymétrique) Double vitrage OUI Pas d’action sur les fenêtres NON Aide à la décision multicritère pour la prescription de scénarios d’amélioration énergétique via une approche globale 71 Certainty Factor). Dans certains cas, le théorème de Bayes (présenté en page 66) permet de déduire les CF d’une action sachant les CF des actions ou faits antécédents. L’interprétation des probabilités dans [102] donne une méthode pour convertir les CF d’une assertion causale en valeur de probabilité conditionnelle.
Réseaux bayésiens
Les réseaux bayésiens reposent sur un formalisme basé sur la fusion des théories des probabilités et des graphes. Ils permettent à un ou plusieurs experts de formaliser leur connaissance sous forme d’un modèle graphique de relations causales (causes effets) indiquant les dépendances entre les variables. Cette description graphique est transformée ensuite en loi de probabilité équivalente afin de prendre en compte les aspects incertains. Concrètement, un réseau bayésien est le rassemblement de deux aspects conceptuels : un aspect graphique, appelé graphe orienté sans circuit (DAG34 en anglais), qui structure la dépendance et la causalité entre les variables sous forme de nœuds et d’arcs orientés ; un aspect quantitatif, appelé espace probabilisé fini, qui décrit cette dépendance entre les variables sous forme de tables de probabilités conditionnelles. Un réseau bayésien est donc un graphe relationnel auquel on a associé une représentation probabiliste sous-jacente. L’utilisation première d’un réseau bayésien est l’inférence de connaissances. Une révision des observations sur un système modélisé permet de mettre à jour dynamiquement les 34 DAG : Directed Acyclic Graph Base de connaissances (règles de connaissances fournies par des experts) Base de faits (données) Moteur d’inférences (logiciel développant le raisonnement du système) Interface homme-machine (logiciel de communication)
Deuxième Partie : Traversée de l’état de l’art 72 tables de probabilités de tous les nœuds du réseau afin de réviser potentiellement son jugement. Il permet donc de voir comment le système évolue au regard d’un complément d’observation, mais aussi d’identifier quels nœuds d’observation sont les plus critiques et donc de focaliser l’action ou la recherche d’informations complémentaires sur ces derniers. La propriété fondamentale des réseaux bayésiens, basée directement sur le théorème de Bayes, établit que la probabilité conditionnelle d’une valeur d’une variable sachant la valeur d’une autre variable peut être calculée par l’équation suivante : ( | ) ( | ) ( ) Par ce principe, les réseaux bayésiens permettent de représenter d’une manière compacte une distribution de probabilité jointe, associée à l’ensemble des variables en utilisant la notion d’indépendance. La distribution de probabilité jointe est décomposée sous forme d’un produit des distributions de probabilités locales selon la règle de chaînage suivante : ∏ | où représente l’ensemble des parents du nœud dans le graphe. En d’autres termes, la probabilité d’une observation (un nœud) dépend des probabilités des observations parentes (nœuds parents). Par rapport aux outils d’inférence fonctionnant à base de règles logiques, le plus souvent utilisés sans les systèmes experts, les réseaux bayésiens permettent d’intégrer l’incertitude dans le raisonnement, aussi bien au niveau des observations que dans les règles conditionnelles.
La quantification de l’incertain sous forme de probabilités permet d’associer à chaque décision, un coefficient ou indicateur de risque, très utile selon la nature de la décision à prendre. Les réseaux bayésiens permettent de rassembler au sein d’un même modèle graphique des données de nature différente (observations, expertises, réglementations, retours d’expérience) pour en extraire des connaissances utiles à la prise de décision, mais aussi contrôler ou prévoir le comportement d’un système, ou encore diagnostiquer les causes d’un phénomène. Ce type de modélisation de la connaissance est utilisé dans de nombreux domaines : santé (diagnostic, localisation de gènes), industrie (contrôle d’automates ou de robots), informatique et réseaux (agents intelligents), marketing (data mining, gestion de la relation client), banque et finances (scoring, analyse financière), management (aide à la décision, knowledge management, gestion du risque), etc. [98]. L’exemple de structure graphique bayésienne, en Figure 19, montre comment des connaissances expertes génériques [volontairement simplifiées pour l’exemple] sont codifiées pour modéliser le risque potentiel d’apparition de pathologies de l’enveloppe lié à un excédent d’humidité dans une maison individuelle. Chaque nœud représente un paramètre intervenant dans le modèle ; chaque flèche les relations entre ces paramètres. Les états des nœuds sans parents « Fenêtres, Isolation thermique de l’enveloppe, ventilation», sont probabilisés à l’aide de lois de probabilités marginales (ex : ). Les relations entre ces nœuds et les autres nœuds, qui possèdent des nœuds parents « Enveloppe étanche à l’air, Risques de pathologies liées à l’humidité », sont quantifiées à l’aide de tables de probabilités conditionnelles (TPC) permettant de lier et probabiliser la connaissance capitalisée.
Introduction |