Maintenance de réseau bayésien pour le diagnostic des pathologies des seins

Maintenance de réseau bayésien pour le diagnostic des pathologies des seins

Les réseaux bayésiens 

Introduction Les réseaux bayésiens, qui doivent leur nom aux travaux de Thomas Bayes au dixhuitième siècle sur « la probabilité des causes », sont le résultat de recherches effectuées dans les années 80. Les réseaux bayésiens constituent une technique d’acquisition de représentation et de manipulation de connaissance et on les utilise, surtout, pour leur capacité d’effectuer des inférences dans un contexte d’incertitude et aussi pour leurs algorithmes d’apprentissages. Ils sont utilisés pour prévoir, contrôler et simuler le comportement d’un système, à analyser des données et à prendre des décisions, à diagnostiquer les causes d’un phénomène observé grâce à la jonction de la théorie des probabilités et de la théorie des graphes, permettant effectivement de décrire les relations régissant un ensemble de variables aléatoires et d’effectuer un raisonnement probabiliste sur celles-ci. D’ailleurs, les domaines d’applications sont variés. Ils ont été développés pour la première fois en médecine dans le cadre de la prévention, le diagnostic [LER02] [BEL02], et autre, dans l’industrie, la classification automatique de documents structurés ou encore l’analyse d’images et bien d’autres domaines [LAB03].

Définition de réseau bayésien

Les réseaux bayésiens [JEN96] [PEA88] [NAï07], également appelés réseaux probabilistes, sont des outils de modélisation de connaissances incertaines et complexes. Ils permettent aussi la représentation des relations d’influences entre ces connaissances. Ils ont été utilisés dans de nombreuses applications telles que dans le diagnostic médical [LER04], en bioinformatique [WIL07], corrélation d’alertes [QIN05] [BEN08a], reconnaissance de la parole [ZHO05], filtrage de spams [SAH98], détection d’intrusions [BEN2008b] [KRU03] [BEN04], etc. Ces modèles de raisonnement probabiliste se caractérisent par deux aspects : un aspect graphique ou qualitatif permettant de représenter d’une manière très simple la connaissance sous forme d’un graphe orienté sans cycles, et un aspect probabiliste ou quantitatif offrant un moyen de quantifier l’incertitude des relations d’influences entre les variables du domaine étudié cet aspect quantitatif est constitué de tables de probabilités dans le cas discret ou de distribution gaussienne dans le cas continu. Plus précisément, un réseau bayésien est défini comme un graphe orienté acyclique (GOA) permettant de représenter les dépendances directes ou conditionnelles entre les variables du domaine étudié. Il est muni d’un ensemble de tables de probabilités conditionnelles (TPC) pour quantifier l’incertitude relative aux relations d’influences.

Définition Formelle

Un réseau bayésien peut être formellement défini par : • un graphe acyclique orienté G, G=G (V, E) où V est l’ensemble des nœuds de G, et E l’ensemble des arcs de G. • un espace probabilisé fini (W, p). • un ensemble de variables aléatoires associées aux nœuds du graphe et définies sur [Ώ, p] tel que∶ p (V1, V2, …, VN) =∏𝑖=1…𝑁 𝑝(𝑣𝑖| 𝑐(𝑣𝑖)) (2.1) Avec C(Vi) l’ensemble des parents de Vi dans le graphe [BOU 05].

Pourquoi utiliser des réseaux bayésiens ?

Selon le type d’application, l’utilisation pratique d’un réseau bayésien peut être envisagée au même titre que celle d’autres modèles : réseau de neurones, système expert, arbre de décision, modèle d’analyse de données (régression linéaire), arbre de défaillances, modèle logique. Naturellement, le choix de la méthode fait intervenir différents critères, comme la facilité, le coût et le délai de mise en œuvre d’une solution. En dehors de toute considération théorique, les aspects suivants des réseaux bayésiens les rendent dans de nombreux cas, préférables à d’autres modèles : ➢ Acquisition des connaissances. La possibilité de rassembler et de fusionner des connaissances de diverses natures dans un même modèle : retour d’expérience (données historiques ou empiriques), expertise (exprimée sous forme de règles logiques, d’équations, de statistiques ou de probabilités subjectives), observations. Dans le monde industriel, par exemple, chacune de ces sources d’information, quoique présente, est souvent insuffisante individuellement pour fournir une représentation précise et réaliste du système analysé.  ➢ Représentation des connaissances. La représentation graphique d’un réseau bayésien est explicite, intuitive et compréhensible par un non-spécialiste, ce qui facilite à la fois la validation du modèle, ses évolutions éventuelles et surtout son utilisation. Typiquement, un décideur est beaucoup plus enclin à s’appuyer sur un modèle dont il comprend le fonctionnement qu’à faire confiance à une boîte noire. ➢ Utilisation des connaissances. Un réseau bayésien est polyvalent : on peut se servir du même modèle pour évaluer, prévoir, diagnostiquer, ou optimiser des décisions, ce qui contribue à rentabiliser l’effort de construction du réseau bayésien. ➢ Qualité de l’offre en matière de logiciels. Il existe aujourd’hui de nombreux logiciels pour saisir et traiter des réseaux bayésiens. Ces outils présentent des fonctionnalités plus ou moins évoluées : apprentissage des probabil ités, apprentissage de la structure du réseau bayésien, possibilité d’intégrer des variables continues, des variables d’utilité et de décision, etc. Nous allons à présent étudier plus en détail ces différents aspects de l’utilisation de réseaux bayésien [NAï07]. 

Représentation graphique de la causalité

Un réseau bayésien (réseau probabiliste ou Bayesian Network) est un modèle représentant des connaissances incertaines sur un phénomène complexe, et permettant, à partir des données, un véritable raisonnement. Un réseau bayésien a pour objectif d’acquérir, de représenter et d’utiliser la connaissance. Il est constitué de deux composantes [BRO 05] : ❖ Un graphe causal, orienté, acycliques, dont les nœuds sont des variables ❖ D’intérêt du domaine, les arcs des relations de dépendance entre ces variables. L’ensemble des nœuds et des arcs forme ce que l’on appelle la structure du réseau bayésien. C’est la représentation qualitative de la connaissance. ❖ Un ensemble de distributions locales de probabilités qui sont les paramètres du réseau. Pour chaque nœud on dispose d’une table de probabilités P(variable/parents(variable)) qui représente la distribution locale de probabilité. Il faut remarquer que l’état de chaque nœud ne dépend que de l’état de ses parents. Il s’agit de la représentation quantitative de la connaissance. On peut décrire un réseau bayésien comme un système expert probabiliste. Dans un réseau bayésien, un arc de A vers B peut être interprété par ‘ A cause B’, les cycles ne sont pas autorisés, et le graphe est un graphe acyclique orienté. De plus un nœud est conditionnellement indépendant de ses non-descendants sachant ses parents. Exemple Dans les réseaux bayésiens, deux nœuds qui représentent deux faits différents peuvent être en relation causale sans que l’un implique l’autre. Graphiquement, chaque parent a un effet sur ses fils. La notion de causalité joue un rôle très important pour construire les réseaux bayésiens [COR 02]. Exemple de réseau bayésien modélisant l’appel potentiel de voisins, suite au déclenchement d’une alarme possiblement causé par un cambriolage ou un tremblement de terre. Notation abrégée : T = Tremblement De Terre, C = Cambriolage, A = Alarme, J = JohnAppelle, M = MarieAppelle. Exemple tiré du livre “Artificial Intelligence : A Modern Approach” de Rusell et Norvig [FAT 07]. La représentation graphique du modèle causal utilisé est dans la figure (Fig.2.1). Cette figure représente un réseau bayésien simple contenant cinq variables binaires, Etant donné un réseau bayésien, la distribution conjointe peut être simplifiée comme suit : P(X1, X2,…, Xn) = P (X1| X2,…, Xn) P(X2,…, Xn) = P (X1| Parents(X1)) P(X2,…, Xn) Règle du produit indépendance Ou le terme conjoint signifie qu’on exprime la probabilité d’observer plusieurs variables simultanément.

Table des matières

Chapitre 1 Aide à la décision pour le diagnostic médical
1.1. Introduction
1.2. Notion de décision médicale
1.3. Qu’est-ce qu’un système d’aide à la décision médicale
1.4. Les champs d’application des SADM
1.5. Les composants d’un système d’aide à la décision médicale
1.6. La typologie des systèmes d’aide au diagnostic médical
1.6.1. Les systèmes d’assistance documentaire
1.6.2. Les systèmes d’alerte ou de rappels automatiques
1.6.3. Les systèmes consultants
1.7. Diagnostic médical
1.7.1. Système d’aide au diagnostic médical
1.7.2. Objectifs des systèmes d’aide à la décision diagnostic médical
1.7. Quelques systèmes d’aide au diagnostic médical
1.4. Les différences mécanisme de raisonnement
1.5. Nos choix et notre démarche
1.6. Conclusion
Chapitre 2 : Les Réseaux Bayésiens
2.1. Introduction
2.2. Définition de réseau bayésien
2.3. Définition Formelle
2.4. Pourquoi utiliser des réseaux bayésiens ?
2.5. Représentation graphique de la causalité
2.5.1. Circulation de l’information dans un graphe causal
2.5.2. Indépendance conditionnelle dans un réseau bayésien : d-séparation
2.5.2.1 Définition d-Séparation
2.6. Une représentation probabiliste associée
2.6.1. L’indépendance conditionnelle
2.7. Formule de bayes
2.7.1. Autres écritures du théorème de Bayes
2.7.2. Exemple d’application de la formule de Bayes
2.8. Construction des réseaux bayésiens
2.8.1. Identification des variables et de leurs espaces d’états
2.8.2. Définition de la structure du réseau bayésien
2.8.3. Loi de probabilité conjointe des variables
2.9. Inférence bayésien
2.9.1. Les algorithmes d’inférence
2.9.1.1. Méthodes d’inférence exactes
2.9.1.2. L’inférence approximative
2.10. Apprentissage
2.10.1. Apprentissage des paramètres
2.10.1.1.À partir de données complètes
2.10.1.2.À partir de données incomplètes
10.2. Apprentissage de la structure.
2.14. Avantages et inconvénients des modèles bayésiens
2.15. Conclusion
Chapitre 3 : outils et domaine d’application
3.1. Introduction
3.2. Historique
3.3. Les outils bayésiens
3.3.1. Hugin
3.3.2. Bayesian network tools in Java « BNJ »
3.3.3. GeNIe
3.3.4. BayesiaLab
3.4. Etude comparative entre les différents outils bayésiens.
3.5. Domaines d’application des réseaux Bayésiens
3.6. L’incertitude
3.6.1. L’incertitude médicale
3.6.2. Réseau bayésien et l’incertitude médicale
3.7. Conclusion
Chapitre 4 : Conception du système SADMseins
4.1. Introduction.
4.2. Description générale de processus du diagnostic
4.3. La conception du SADMsein
4.3.1. Définition des variables du réseau
4.3.2 Construction du réseau bayésien
4.3.3. Préparation des données dans le cadre de l’apprentissage automatique
4.3.4. L’algorithme d’inférence utilisé
4.3.4.1. Arbre de jonction (JLO)
4.3.5. La recherche
4.4. Maintenance du système de diagnostic médical
4.5. Pour quels types d’applications en maintenance ?
4.6. Maintenance de réseau bayésien.
4.6.1. Maintenance de la structure réseau bayésien
4.6.2. Choix des actions de maintenance
4.6.3. Intégration des actions de maintenance
4.7. Conclusion
Chapitre 5 : Implémentation du système SADMseins
5.1. Introduction
5.2. Spécification de l’outil de développement (SMILE/GeNIe)
5.3. Les exigences matérielles et logicielles
5.4. Interface principale de GeNIe
5.5. Étude de cas
5.5.1. Création du réseau bayésien
5.5.2. La collection des données
5.5.3. Affectation des paramètres
5.5.4. Algorithme d’inférence
5.5.3.1. Pourquoi choisir l’algorithme arbre de jonction
5.5.5. La validation du système SADMseins(résultats)
5.7. Discussion des résultats de diagnostic de notre système
4.8. Les résultats apportés par la maintenance
4.9. Évaluation de la performance
4.10. Conclusion

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *