La multireprésentation dans les SIG
La multireprésentation des données dans les SIG est un vaste domaine et englobe plusieurs significations. Nous allons présenter celles qui nous semblent les plus pertinentes dans notre étude. De manière générale, la multireprésentation désigne la multitude des aspects sous lesquels la réalité géographique peut intéresser les personnes à un instant donné. Une même portion de territoire est perçue de façons très différentes par des gestionnaires de patrimoines immobiliers, des économistes, des agriculteurs, ou encore des touristes planifiant leurs vacances. La quantité et la nature de l’information, la précision et le mode de représentation cartographique varient selon le profil (Moisuc et al., 2004). Par exemple, la représentation d’un site urbain peut demander beaucoup de détail pour un architecte créant un nouveau projet (forme et emplacement exact, utilisation, nature du terrain…) et une description plus sommaire pour une personne travaillant dans le domaine des risques hydrologiques (inondabilité, vulnérabilité). On peut distinguer deux approches dans le phénomène de la multireprésentation : les sources et les applications. Les principales sources de représentations multiples dans les SIG sont la prise en compte d’échelles multiples, la prise en compte de différents points de vue et la prise en compte de temps (Moisuc et al., 2004). Parmi les types d’applications multireprésentations (Devogele, 1997) en a cités sept que nous pouvons compléter avec des applications apparues ces dernières années comme la 3D et les ontologies (Mao, 2011) (Cullot et al., 2003): les trois premiers types répondent aux besoins des utilisateurs : cartographie électronique, analyse, navigation, 3D et ontologies les quatre suivants sont plus spécifiques aux producteurs de bases de données géographiques : contrôle de cohérence, dérivation de bases de données ayant une représentation hétérogène, propagation des mises à jour et serveur de données multireprésentation. Nous allons étudier plus en détail ces différentes approches.
La multireprésentation en cartographie
La gestion des représentations en cartographie est essentiellement liée à trois types d’information : la gestion de la résolution, la gestion des thèmes et les informations de mise à jour. Pour pouvoir générer des cartes de différentes échelles, il est nécessaire de stocker des données correspondant à plusieurs résolutions : une résolution par intervalle d’échelle à représenter, et ceci pour chaque territoire étudié lorsque cela est nécessaire. Dans le cas des cartes papier, cela revient à stocker posséder plusieurs cartes d’une même zone avec des représentations différentes et faire soi-même le rapprochement entre ces cartes. L’idéal serait d’être La multireprésentation dans les SIG Chapitre 3. –Etat de l’art Mémoire de Thèse Page 99 capable de stocker uniquement les données correspondant au niveau de détail le plus fin, et d’en déduire, par généralisation, les données moins détaillées au moment de la requête. Cependant, le processus de généralisation cartographique (obtention des cartes à des échelles plus petites à partir des cartes à des échelles plus grandes) n’est pas entièrement automatisable et de plus, dans les cas où cela s’avère possible, il s’agit d’un processus très coûteux en temps de calcul (Davis et Laender, 1999). La solution largement utilisée aujourd’hui consiste à stocker explicitement plusieurs résolutions de données pour une même zone. Cela peut se faire de deux manières : en réalisant une base de données par résolution ou en utilisant une seule base stockant plusieurs résolutions. La Figure 39 montre un exemple de différentes représentations d’une même zone selon différentes échelles (généralisation cartographique). Les données proviennent du Géoportail et les échelles ne sont pas forcément habituelles comparées aux versions des cartes papier que l’on a l’habitude de manipuler. Ainsi, plusieurs représentations des mêmes données à des échelles différentes et selon différents thèmes et à différentes époques doivent pouvoir être gérées. Les critères de sélection cartographique pour afficher les informations cohérentes sont, d’après (Devogele, 1997) : Les circonstances d’utilisation La densité d’information La catégorie de l’usager L’intérêt La date La distance entre les objets. Ces critères sont décrits dans notre architecture de modélisation d’environnement urbain sous la forme de contexte d’utilisation, explicitement (circonstance, date) ou implicitement (densité, distance). Figure 39. Exemple de généralisation cartographique (données issues du Géoportail) Une majorité de SIG stockent l’information par résolution. Un des problèmes rencontrés pour notre étude est qu’en passant d’une résolution à l’autre, il n’y a aucune liaison entre l’identité des objets représentés (manque de sémantique). Cela pose certains problèmes pour les utilisateurs finaux (une analyse combinant plusieurs résolutions devient très difficile), mais aussi pour les concepteurs, en termes de propagation des mises à jour et de maintien de la cohérence de données. Si l’on prend en exemple une parcelle stockée dans plusieurs bases données sur laquelle on souhaite construire un ouvrage, ce changement doit être introduit dans chaque base de données. De plus, le mécanisme de vérification de la propagation des modifications et de vérifications de leur cohérence est complexe à mettre en place. Une autre solution, plus efficace et plus expressive, consiste à stocker une seule instance dans la base de données pour chaque objet du monde réel. Un SIG fondé sur une telle approche permet un plus de flexibilité et d’efficacité, mais il doit s’appuyer sur une structure de données capable de résoudre plusieurs problèmes (Moisuc et al., 2004) : La gestion de géométries multiples SIGA3D Page 100 Clément Mignard la gestion de plusieurs niveaux d’abstraction et de la visibilité des objets ; la gestion de multiples niveaux d’abstraction dans la partie attributaire des objets ; l’introduction du temps dans les SGBD a pour but de représenter la réalité en différents points de l’axe temporel ; la gestion de points de vue multiples.
La multireprésentation dans les ontologies
Nous commencerons par présenter dans ce paragraphe ce qui définit une ontologie, et notamment le concept d’ontologie géographique, un cas particulier des ontologies dynamiques. Puis nous présenterons un peu plus en détail le modèle MADS, une approche qui a été utilisée pour la multireprésentation sémantique. Enfin, nous essaierons de mettre en avant les concepts que nous pouvons réutiliser pour la construction d’une ontologie dynamique appliquée à la description d’un UIM.
Ontologie géographique / évolutive
Il existe de fait différents types d’ontologies dont nous pouvons trouver une rapide description dans l’article (Cullot et al., 2003). Cet article traite plus particulièrement des ontologies dans le domaine géographique. Il y est notamment expliqué que le terme d’ontologie peut désigner, entre autres et de façon concrète, une liste de termes reliés entre eux par des liens sémantiques tels que synonymie, hyponymie ou hyperonymie, ce qui définit un « thésaurus » (ontologie de haut niveau). Mais il peut également désigner une structure plus complexe s’apparentant à un schéma conceptuel de base de données, que l’on appelle « ontologie descriptive ». C’est avec ce type d’ontologie que l’on peut construire des ontologies de domaines ou de tâches en utilisant des concepts et des relations sémantiquement riches, ceux-ci pouvant être représentés dans des langages à base de logiques de description (Wache et al., 2001). Il reste maintenant à définir la manière de conceptualiser les informations qui, au sein de l’ontologie, évoluent en fonction du temps et de l’espace. Ces informations ne sont pas naturelles à modéliser (par exemple il n’existe pas à l’origine de facilité pour modéliser des informations spatiales en Logique de Description (LD)) malgré le besoin qui s’en fait ressentir, notamment dans les domaines des systèmes d’information géographique. Nous allons nous baser pour ce faire sur une ontologie d’application, dite géographique, où la notion d’espace est la plus naturelle. Commençons par définir les besoins inhérents en termes de conceptualisation des ontologies géographiques. Leur nature d’ontologie d’application en font des structures composées qui recouvrent des ontologies de domaines et d’activités géographiques, basés sur un haut niveau qui permet de décrire spécifiquement des concepts qui caractérisent l’espace (comme le point, la ligne…) et où ceux-ci sont spatialisés, c’est-à-dire localisé dans l’espace et souvent le temps. Les besoins pour de telles ontologies sont, d’après (Cullot et al., 2003) : de pouvoir définir la spatialité à l’aide de types de données spatiales variées (ligne, point, surface simple…), de types d’objets spatiaux (i.e. d’objets ayant des attributs spatiaux), de relations spatiales comme les relations topologiques et/ou des champs continus (raster). définir intentionnellement des concepts spatiaux à l’aide d’axiomes contenant des prédicats spatiaux, raisonner sur la spatialité des instances, i.e. inférer à partir des relations spatiales décrites l’ensemble des relations spatiales valides. Le prochain paragraphe présente une approche qui permet de résoudre la problématique de la conceptualisation de la spatialité dans des ontologies comme celle décrite ci-dessus ; il s’agit de MADS, un modèle conceptuel relationnel qui donne les bases de la multireprésentation sémantique évoquée dans nos objectifs.
MADS et ses applications aux ontologies géographiques
Le modèle de données MADS (Spaccapietra et al., 2002) vise à définir une approche pour manipuler des bases de données géographiques dans lesquelles une même information peut avoir plusieurs représentations en fonction du temps et de l’espace. L’élaboration du modèle conceptuel MADS a été guidée par les objectifs suivants, détaillés dans (Parent et al., 1998) : l’orthogonalité des dimensions structurelle, spatiale et temporelle (c’est-à-dire que le choix d’un mode de représentation pour l’une des dimensions n’influence pas les autres) la possibilité de décrire des relations topologiques ou temporelles entre les entités de manière explicite, une définition formelle des concepts tels l’agrégation spatiale ou temporelle, la généralisation/spécialisation et les mécanismes d’héritage associés, la possibilité de décrire des champs spatiaux continus, la provision de types spatiaux génériques au-delà des types de base, des notations visuelles intuitives. MADS est un modèle conceptuel relationnel (entité – association) étendu aux concepts principaux de l’approche orientée objet (structures complexes, héritage et méthodes). Il propose un ensemble de quatre composantes pour résoudre ces différentes problématiques (structurelle, spatiale, temporelle et multireprésentation). Nous allons voir comment l’on peut intégrer ce mécanisme de représentation au sein d’une ontologie. L’extension de MADS décrite dans (Vangenot, 2004) permet à un phénomène d’avoir plusieurs représentations au sein d’une même base de données. La notion de multireprésentation est apparue dans le domaine des Systèmes d’Information Géographique, dans le but de gérer plusieurs représentations différentes des mêmes objets géographiques selon différents points de vue ou selon différents niveaux de résolution. Dans le domaine de la modélisation d’information, le problème de la multireprésentation est connu depuis longtemps au travers de l’utilisation des vues dans les bases de données pour personnaliser l’accès d’un groupe d’utilisateurs. On peut supposer qu’une des origines de la représentation multiple vient du caractère subjectif de la modélisation des bases de données. Mais l’information peut également être une entité sujette à différentes représentations selon le contexte dans lequel elle est considérée.