Optimisation de la recherche d’un cas Bayésien

Approche du raisonnement à partir de cas

Le raisonnement à partir de cas est un des types de raisonnement en IA, dans le domaine de l’apprentissage automatique. Raisonner à partir de cas signifie se remémorer des situations passées, similaires à la situation courante et utiliser ces situations pour aider à résoudre la situation courante. Le raisonnement à partir de cas est une forme de raisonnement par analogie. L’analogie proprement dite recherche les relations de cause à effet dans les situations passées pour les transposer à la situation courante ainsi que les ressemblances entre les situations passées et la situation courante. Le raisonnement à partir de cas recherche seulement les ressemblances ou les relations de proximité entre les situations passées et la situation courante. Le RàPC envisage le raisonnement comme un processus de remémoration d’un petit ensemble de situations concrètes : les cas. Il fonde ses décisions sur la comparaison de la nouvelle situation (cas cible) avec les anciennes (cas sources). Le principe général du RàPC consiste à traiter un nouveau problème (cas cible) en se remémorant des expériences passées voisines (cas de référence). Ce type de raisonnement repose sur l’hypothèse suivante : si une expérience passée et la nouvelle situation sont suffisamment similaires, alors tout ce qui peut être expliqué ou appliqué à l’expérience passée (base de cas) reste valide si on l’applique à la nouvelle situation qui représente le nouveau problème à résoudre [AAM 94].

Connaissances dans un système RàPC

Richter [RIC 98] définit les systèmes de RàPC comme des systèmes à base de connaissances (SBC). Ces systèmes exploitent quatre catégories de connaissances (“knowledge containers”) distinctes à savoir : vocabulaire d’indexation : un ensemble d’attributs ou de traits (“features”) qui caractérisent la description de problèmes et de solutions du domaine. Ces attributs sont utilisés pour construire la base de cas et jouent un rôle important lors de la phase de recherche.
base de cas : l’ensemble des expériences structurées qui seront exploitées par les phases de recherche, d’adaptation et de maintenance.
mesures de similarité : des fonctions pour évaluer la similarité entre deux ou plusieurs cas. Ces mesures sont définies en fonction des traits et sont utilisées pour la recherche dans la base de cas. connaissances d’adaptation : des heuristiques du domaine, habituellement sous forme de règle traits permettant de modifier les solutions et d’évaluer leur applicabilité à de nouvelles situations.

Organisation de la mémoire de cas

Les processus de mémorisation et de remémoration sont fortement liés à la façon d’organiser les cas dans la base. Dans cette section, nous allons aborder différentes méthodes d’organisation des cas en mémoire. Elles se résument en deux catégories principales:
La mémoire plate : il s’agit de mémoriser tous les cas dans une liste séquentielle. Nous détaillons ce type de mémoire dans la section suivante.
La mémoire hiérarchique : lorsque la mémoire des cas est large, il y a une nécessité d’organiser les cas hiérarchiquement. Ceci permet de simplifier la remémoration. Par la suite, nous présentons deux approches pour l’organisation hiérarchique des cas en mémoire : les réseaux à trait partagés et les arbres de discriminations.

Exemple de modèles hybrides de mémoire de cas

Le modèle PROBIS : un modèle hybride de mémoire : PROBIS (Prototype-Based Indexing System) est un modèle de mémoire hybride proposé par Malek en 1996 [MAL 96] intégrant un réseau incrémental à base de prototypes et une mémoire plate partitionnée en plusieurs groupes. Ce modèle complet permet de combiner plusieurs avantages : une remémoration efficace et précise en même temps, une mémorisation simple et un traitement des cas atypiques et frontières. Ce modèle forme une mémoire à deux niveaux de hiérarchie: le bas niveau qui comprend une mémoire plate contenant des cas organisés en groupes ou chaque groupe contient un ensemble de cas similaires; le haut niveau qui contient des prototypes, chaque prototype représente un groupe de cas du bas niveau.
L’ensemble de ces prototypes forme un système d’indexation pour les différents groupes dans la mémoire plate. L’utilisation d’un réseau incrémental à base de prototypes permet de construire les prototypes représentatifs des différents groupes et d’organiser les cas dans les différents groupes. Réseaux de recherche de cas : CRN : Le principe des CRNs (Case Retrieval Nets) est inspiré des réseaux de neurones et des modèles de mémoires associatives. L’idée de [NOU 04] est que le processus de rappel d’un cas ne se fait pas en parcourant un chemin dans une arborescence mais plutôt de façon reconstructive en récupérant graduellement les entités d’information constituants le cas. Les connaissances de base dans les CRNs sont les entités d’information (IEs). Un cas est un ensemble de ces entités. Une mémoire de cas est alors : un réseau de nœuds correspondant aux IEs du domaine ainsi que de nœuds additionnels dénotant le cas. Les nœuds IEs sont connectés par des arcs de similarité et les nœuds cas sont accessibles à partir des IEs les constituants à travers des arcs de pertinence. Différents degrés de similarité et de pertinence peuvent être exprimés en faisant varier le poids des arcs.

Système d’aide au diagnostic médical

Plusieurs définitions, du système d’aide au diagnostic, ont été proposées dans la littéraire. Sim et al. [KON 08][ALE 10] ont proposé la définition suivante : « Software designed to be a direct aid to clinical decision-making, in which the characteristics of an individual patient are matched to a computerized clinical knowledge base and patient specific assessments or recommendations are then presented to the clinician or the patient for a decision ». Kawamoto et al. [KAW 05] ont défini le système d’aide au diagnostic comme suit : « We defined a clinical decision support system as any electronic or non-electronic system designed to aid directly in clinical decision making, in which characteristics of individual patients are used to generate patient-specific assessments or recommendations that are then presented to clinicians for consideration ».
Ces différentes définitions confirment le fait que l’aide (i.e. informations obtenues par le système) fournie au médecin dans son processus de diagnostic, peut prendre plusieurs formes (i.e. cas similaires déjà diagnostiqués, diagnostics potentiels, etc.). En effet, les systèmes d’information, les bases de données et les dossiers informatisés facilitent la prise de décision en améliorant l’accès aux données pertinentes et leur mise en perspective. Néanmoins, il ne s’agit que d’une aide indirecte présentant des faits sur lesquels le décideur doit appliquer un raisonnement. Les systèmes d’aide à la décision ont l’ambition d’assister le médecin, en remplaçant ou en reproduisant le raisonnement humain. Les systèmes experts, les systèmes d’apprentissage, les systèmes de fouille de données, les systèmes d’indexation et de recherche d’images, les systèmes de raisonnement à base de cas et les systèmes de raisonnement par classification sont tous des exemples des systèmes d’aide au diagnostic. Parmi ces différents types de systèmes d’aide au diagnostic proposés dans la littérature, nous nous intéressons particulièrement aux systèmes fondés sur le raisonnement à partir de cas.

Table des matières

Introduction générale
Chapitre 1 : Le Raisonnement à Partir de Cas et le diagnostic médical 
1. Introduction
2. Approche du Raisonnement à Partir de Cas
2.1. Historique
2.2. Les origines des systèmes RàPC
2.2.1. Théorie de la mémoire
2.2.2. Le raisonnement par analogie
2.2.2.1. Finalités du raisonnement par analogie
2.2.2.2. Formalisation et terminologie
2.3. Représentation d’un cas
3. Composantes d’un système de Raisonnement à Partir de Cas
3.1. Processus
3.1.1. Remémoration
3.1.1.1. Les techniques de recherche des cas similaires
3.1.2. Adaptation ou réutilisation
3.1.3. Maintenance ou révision
3.1.4. Construction ou apprentissage
3.2. Connaissances dans un système à base de cas
4. Organisation de la mémoire
4.1. Organisation plate
4.2. Réseaux à caractéristiques partagées
4.3. Réseaux de discrimination
4.4. Réseaux redondants de discrimination
4.5. Exemple de modèles hybrides de mémoire de cas
4.5.1. Le modèle PROBIS : un modèle hybride de mémoire
4.5.2. Réseaux de recherche de cas : CRN
5. Diagnostic médical
5.1. La notion de diagnostic médical
5.2. Système d’aide au diagnostic médical
6. Les principaux systèmes RàPC en diagnostic médical
6.1. Système CASEY
6.2. Système PROTOS
6.3. Système IDEM
7. Discussion : vers un model probabiliste de mémoire de cas
8. Nos choix et notre démarche
9. Conclusion
Chapitre 2 : Les Réseaux Bayésiens
1. Introduction
2. Définition
3. Définition Formelle
4. Représentation graphique de la causalité
4.1. Exemple
4.2. Circulation de l’information
4.3. Définitions et propriétés
4.3.1. Indépendance conditionnelle
4.3.2. D-séparation
5. Représentation probabiliste de la causalité 
6. Formule de Bayes
6.1. Autres écritures du théorème de Bayes
6.2. Exemple d’application de la formule de Bayes
7. Construction des réseaux bayésiens
7.1. Identification des variables et de leurs espaces d’états
7.2. Définition de la structure du réseau bayésien
7.3. Loi de probabilité conjointe des variables
8. Inférence
8.1. L’inférence exacte
8.1.1. Propagation de messages (Algorithme Pearl)
8.1.2. l’arbre de Jonction (Clique Tree propagation)
8.2. L’inférence approximative
9. Domaines d’application des réseaux bayésiens
10. L’incertitude 
10.1. L’incertitude médicale
10.2. Réseau bayésien et l’incertitude médicale
11. Avantages des réseaux bayésiens 
12. Conclusion
Chapitre 3 : Intégration des Réseaux Bayésiens dans le Raisonnement à Partir de Cas
1. Introduction 
2. Les différentes architectures CBR/BN 
3. Etat de l’art des principaux systèmes intégrants le BN dans le CBR
3.1. Le système Creek
3.2. Le système INBANCA
3.3. Le système développé par Silvia et el
3.4. Le système Bayesian Case Construction (BCR)
3.5. Le système développé par Gomes P et al
3.6. Le système développé par Tran H et al
3.7. Le système développé par Pavon F et al
3.8. Le système développé par Dong et al
3.9. Le système développé par Gravem A
3.10. Le système ABM
4. Discussion
5. Notre démarche
6. Conclusion
Chapitre 4 : Modélisation bayésienne de la remémoration et de l’adaptation pour l’aide au diagnostic médical
1. Introduction
2. Description générale du problème médical 
3. Base de cas
4. Réseaux bayésiens et diagnostic médical
4.1. Introduction
4.2. Définition des variables du réseau
4.3. Exemple de réseau bayésien
4.4. Inférence
4.4.1. Exemple de propagation d’un message par l’algorithme Pearl
4.4.2. Modèles log-linéaires
5. Intégration des réseaux bayésiens dans le CBR 
5.1. Modélisation de la base de cas par un réseau bayésien
5.2. Description d’un cas du système CBR
5.3. Architecture de la base de cas
6. La phase de la remémoration 
6.1. Processus d’initialisation
6.2. Processus de propagation (Extension de l’algorithme Pearl)
6.3. Processus de recherche
6.3.1. L’utilisation du modèle Log linéaire
6.3.2. L’algorithme de la remémoration proposé
7. La phase d’adaptation 
7.1. Définition de la mesure d’adaptation
7.2. L’algorithme d’adaptation proposé
8. Discussion 
9. Conclusion 
Chapitre 5 : Expérimentation
1. Introduction
2. Validation des phases de remémoration et d’adaptation
2.1. Base de tests
2.2. La phase de remémoration
2.3. La phase d’adaptation
3. Remémoration par l’algorithme Pearl
4. Remémoration par l’algorithme de l’arbre de Jonction JLO
5. Etude comparative
6. Outil graphique du logiciel
6.1. La structure du réseau
6.2. La base de cas
6.3. Ajout d’un nouveau cas
6.4. Autre graphique
7. Conclusion
Conclusion et perspectives 
Annexe A : La probabilité conditionnelle et le théorème de Bayes
Annexe B : Les termes médicaux
Bibliographie

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *