Maintenance de réseau bayésien pour le diagnostic des pathologies des seins
Les réseaux bayésiens
Introduction Les réseaux bayésiens, qui doivent leur nom aux travaux de Thomas Bayes au dixhuitième siècle sur « la probabilité des causes », sont le résultat de recherches effectuées dans les années 80. Les réseaux bayésiens constituent une technique d’acquisition de représentation et de manipulation de connaissance et on les utilise, surtout, pour leur capacité d’effectuer des inférences dans un contexte d’incertitude et aussi pour leurs algorithmes d’apprentissages. Ils sont utilisés pour prévoir, contrôler et simuler le comportement d’un système, à analyser des données et à prendre des décisions, à diagnostiquer les causes d’un phénomène observé grâce à la jonction de la théorie des probabilités et de la théorie des graphes, permettant effectivement de décrire les relations régissant un ensemble de variables aléatoires et d’effectuer un raisonnement probabiliste sur celles-ci. D’ailleurs, les domaines d’applications sont variés. Ils ont été développés pour la première fois en médecine dans le cadre de la prévention, le diagnostic [LER02] [BEL02], et autre, dans l’industrie, la classification automatique de documents structurés ou encore l’analyse d’images et bien d’autres domaines [LAB03].
Définition de réseau bayésien
Les réseaux bayésiens [JEN96] [PEA88] [NAï07], également appelés réseaux probabilistes, sont des outils de modélisation de connaissances incertaines et complexes. Ils permettent aussi la représentation des relations d’influences entre ces connaissances. Ils ont été utilisés dans de nombreuses applications telles que dans le diagnostic médical [LER04], en bioinformatique [WIL07], corrélation d’alertes [QIN05] [BEN08a], reconnaissance de la parole [ZHO05], filtrage de spams [SAH98], détection d’intrusions [BEN2008b] [KRU03] [BEN04], etc. Ces modèles de raisonnement probabiliste se caractérisent par deux aspects : un aspect graphique ou qualitatif permettant de représenter d’une manière très simple la connaissance sous forme d’un graphe orienté sans cycles, et un aspect probabiliste ou quantitatif offrant un moyen de quantifier l’incertitude des relations d’influences entre les variables du domaine étudié cet aspect quantitatif est constitué de tables de probabilités dans le cas discret ou de distribution gaussienne dans le cas continu. Plus précisément, un réseau bayésien est défini comme un graphe orienté acyclique (GOA) permettant de représenter les dépendances directes ou conditionnelles entre les variables du domaine étudié. Il est muni d’un ensemble de tables de probabilités conditionnelles (TPC) pour quantifier l’incertitude relative aux relations d’influences.
Définition Formelle
Un réseau bayésien peut être formellement défini par : • un graphe acyclique orienté G, G=G (V, E) où V est l’ensemble des nœuds de G, et E l’ensemble des arcs de G. • un espace probabilisé fini (W, p). • un ensemble de variables aléatoires associées aux nœuds du graphe et définies sur [Ώ, p] tel que∶ p (V1, V2, …, VN) =∏𝑖=1…𝑁 𝑝(𝑣𝑖| 𝑐(𝑣𝑖)) (2.1) Avec C(Vi) l’ensemble des parents de Vi dans le graphe [BOU 05].
Pourquoi utiliser des réseaux bayésiens ?
Selon le type d’application, l’utilisation pratique d’un réseau bayésien peut être envisagée au même titre que celle d’autres modèles : réseau de neurones, système expert, arbre de décision, modèle d’analyse de données (régression linéaire), arbre de défaillances, modèle logique. Naturellement, le choix de la méthode fait intervenir différents critères, comme la facilité, le coût et le délai de mise en œuvre d’une solution. En dehors de toute considération théorique, les aspects suivants des réseaux bayésiens les rendent dans de nombreux cas, préférables à d’autres modèles : ➢ Acquisition des connaissances. La possibilité de rassembler et de fusionner des connaissances de diverses natures dans un même modèle : retour d’expérience (données historiques ou empiriques), expertise (exprimée sous forme de règles logiques, d’équations, de statistiques ou de probabilités subjectives), observations. Dans le monde industriel, par exemple, chacune de ces sources d’information, quoique présente, est souvent insuffisante individuellement pour fournir une représentation précise et réaliste du système analysé. ➢ Représentation des connaissances. La représentation graphique d’un réseau bayésien est explicite, intuitive et compréhensible par un non-spécialiste, ce qui facilite à la fois la validation du modèle, ses évolutions éventuelles et surtout son utilisation. Typiquement, un décideur est beaucoup plus enclin à s’appuyer sur un modèle dont il comprend le fonctionnement qu’à faire confiance à une boîte noire. ➢ Utilisation des connaissances. Un réseau bayésien est polyvalent : on peut se servir du même modèle pour évaluer, prévoir, diagnostiquer, ou optimiser des décisions, ce qui contribue à rentabiliser l’effort de construction du réseau bayésien. ➢ Qualité de l’offre en matière de logiciels. Il existe aujourd’hui de nombreux logiciels pour saisir et traiter des réseaux bayésiens. Ces outils présentent des fonctionnalités plus ou moins évoluées : apprentissage des probabil ités, apprentissage de la structure du réseau bayésien, possibilité d’intégrer des variables continues, des variables d’utilité et de décision, etc. Nous allons à présent étudier plus en détail ces différents aspects de l’utilisation de réseaux bayésien [NAï07].
Représentation graphique de la causalité
Un réseau bayésien (réseau probabiliste ou Bayesian Network) est un modèle représentant des connaissances incertaines sur un phénomène complexe, et permettant, à partir des données, un véritable raisonnement. Un réseau bayésien a pour objectif d’acquérir, de représenter et d’utiliser la connaissance. Il est constitué de deux composantes [BRO 05] : ❖ Un graphe causal, orienté, acycliques, dont les nœuds sont des variables ❖ D’intérêt du domaine, les arcs des relations de dépendance entre ces variables. L’ensemble des nœuds et des arcs forme ce que l’on appelle la structure du réseau bayésien. C’est la représentation qualitative de la connaissance. ❖ Un ensemble de distributions locales de probabilités qui sont les paramètres du réseau. Pour chaque nœud on dispose d’une table de probabilités P(variable/parents(variable)) qui représente la distribution locale de probabilité. Il faut remarquer que l’état de chaque nœud ne dépend que de l’état de ses parents. Il s’agit de la représentation quantitative de la connaissance. On peut décrire un réseau bayésien comme un système expert probabiliste. Dans un réseau bayésien, un arc de A vers B peut être interprété par ‘ A cause B’, les cycles ne sont pas autorisés, et le graphe est un graphe acyclique orienté. De plus un nœud est conditionnellement indépendant de ses non-descendants sachant ses parents. Exemple Dans les réseaux bayésiens, deux nœuds qui représentent deux faits différents peuvent être en relation causale sans que l’un implique l’autre. Graphiquement, chaque parent a un effet sur ses fils. La notion de causalité joue un rôle très important pour construire les réseaux bayésiens [COR 02]. Exemple de réseau bayésien modélisant l’appel potentiel de voisins, suite au déclenchement d’une alarme possiblement causé par un cambriolage ou un tremblement de terre. Notation abrégée : T = Tremblement De Terre, C = Cambriolage, A = Alarme, J = JohnAppelle, M = MarieAppelle. Exemple tiré du livre “Artificial Intelligence : A Modern Approach” de Rusell et Norvig [FAT 07]. La représentation graphique du modèle causal utilisé est dans la figure (Fig.2.1). Cette figure représente un réseau bayésien simple contenant cinq variables binaires, Etant donné un réseau bayésien, la distribution conjointe peut être simplifiée comme suit : P(X1, X2,…, Xn) = P (X1| X2,…, Xn) P(X2,…, Xn) = P (X1| Parents(X1)) P(X2,…, Xn) Règle du produit indépendance Ou le terme conjoint signifie qu’on exprime la probabilité d’observer plusieurs variables simultanément.
Chapitre 1 Aide à la décision pour le diagnostic médical |