REPRESENTATION DES CONNAISSANCES UTILES A L’EVALUATION DE LA COHERENCE

REPRESENTATION DES CONNAISSANCES UTILES A L’EVALUATION DE LA COHERENCE

DEFINITION DE LA NOTION DE COHERENCE ENTRE DONNEES DE BASES DE DONNEES GEOGRAPHIQUES

Nous abordons dans cette partie le problème de la cohérence entre les données de bases de données géographiques en adoptant le modèle KRA [Saitta et Zucker 2001, Zucker 2001, Zucker 2003]. Le modèle KRA a été initialement défini dans le cadre de l’apprentissage automatique, dans le but de modéliser la notion de changement de représentation.

Il se prête bien à la formalisation du problème que nous traitons dans ce travail et a d’ailleurs déjà été utilisé pour décrire la tâche de généralisation cartographique [Mustière et al. 2000a]. Dans le modèle KRA, un contexte de raisonnement (R) distingue quatre niveaux de représentation différents :

le niveau de perception (P), stocké dans une structure (S), dans laquelle sont symbolisées les données pour communiquer avec d’autres agents à travers un langage (L), sur lesquelles il est possible de raisonner au moyen de théories (T).

Le niveau P correspond aux stimulis perçus. Il spécifie la nature des éléments qui constituent le résultat d’une perception [Zucker 2001]. Dans notre contexte, nous l’assimilons au terrain nominal qui correspond à une image de l’univers géographique vu à travers le filtre des spécifications [David et Fasquel 1997]. C’est donc la réalité physique terrestre à cartographier, reformulée et abstraite dans les termes des spécifications. La structure S est une représentation en extension de cette perception.

Elle constitue le support à la mémorisation des stimulis perçus. Ce niveau S correspond donc à la base de données géographiques elle-même, dans laquelle les objets sont stockés selon une liste de coordonnées et décrits au moyen d’un ensemble d’attributs.

Pour communiquer et décrire de manière symbolique les éléments perçus, un langage L est requis. Dans notre contexte, il s’agit du langage cartographique, régi par les règles de sémiologie graphique [Bertin 1973].

Enfin, pour raisonner sur les éléments perçus exprimés dans le langage, une théorie T est nécessaire. Nous l’assimilons ici à l’analyse spatiale. Ce contexte de raisonnement distinguant les quatre niveaux de représentation est illustré à la figure 32.

Perception P W Mémorisation M P=P(w) Description D S=M(P) Théorisation T L=D(S) Terrain Nominal BDG T=T(L) Plus court chemin : 11 km Figure 32. Le contexte de raisonnement d’une base de données géographiques et ses quatre niveaux de représentation associés définis d’après le modèle KRA. (D’après [Saitta et Zucker 2001, Zucker 2003]).

CORRESPONDANCES ENTRE LES NIVEAUX DE REPRESENTATION

Il existe une relation de dépendance entre chaque niveau de représentation et celle-ci est illustrée par les différents processus : perception, mémorisation, description, théorisation (figure 32). Dans notre contexte de raisonnement, le processus de perception peut correspondre au processus mental suivi par l’expert du domaine pour conceptualiser l’univers à travers les spécifications.

Le niveau P auquel il aboutit et qui correspond au terrain nominal est une vision théorique. Ce modèle n’est en effet pas directement accessible : mémorisé, il devrait être assimilé à une base de données au contenu virtuellement parfait, ce qui est impossible en pratique. La mémorisation peut représenter l’opération de saisie de la base, autrement dit, l’enregistrement du terrain nominal.