Approche d’indexation sémantique à base de services web

Cours approche d’indexation sémantique à base de services web, tutoriel & guide de travaux pratiques en pdf.

Conception des services web d’indexation

Introduction

Dans les chapitres précédents nous avons présenté les notions de base pouvant nous servir µa mettre en ¾uvre une indexation sémantique µa base de services Web. Dans ce chapitre, il s’agit en partie de mobiliser ces notions afln de concevoir des services web permettant une indexation sémantique de sources d’informations hétérogènes et distribuées de nature médicale. Ces services doivent, en outre, ^etre capables de s’insérer dans le cadre d’un système de médiation (notamment lors de la réécriture de requ^etes impliquant ces services d’indexation). De ce fait, la suite de ce chapitre sera consacrée µa la présentation de notre proposition dans un cadre d’usage global dont l’objectif flnal est la médiation entre systèmes hétérogènes. Pour ce faire, nous allons commencer par décrire l’architecture globale du système de médiation.

Contexte general : Mediation a base de services Web

support du processus d’indexation et d’exploitation des résultats de notre approche. Nous allons décrire par la suite les principales étapes concernées par l’indexation µa l’aide de diagrammes. Nous détaillerons également les caractéristiques des services web et les algorithmes nécessaires pour la réalisation de l’indexation.

Contexte général : Médiation µa base de services Web

Dans la Figure 3.1, nous présentons l’architecture globale du système, afln de mon-trer la partie concernée par ce travail dans son contexte général, c’est µa dire : l’architec-ture d’un système de médiation et d’interrogation des sources de données hétérogènes médicales (rapports médicaux, imagerie médicale annotée, . . .) µa base de services web.
Fig. 3.1: Architecture du système global

Contexte general : Mediation a base de services Web

Description de l’architecture globale

Le système global est divisé en deux parties, une partie pour l’interrogation et l’autre pour l’indexation. La partie interrogation concerne les sources de données structurées qui peuvent ^etre interrogées par des langages classiques : SQL, SPARQL, …, alors que la partie indexation concerne les sources de données semi ou non structurées qui peuvent ^etre indexées et seront interrogées en utilisant des méthodes de recherche qui se basent sur des index.
La partie qui nous concerne dans ce travail est celle de l’indexation. Nous remarquons que dans notre partie indexation (délimitée en rouge) dans la Figure 3.1, l’utilisateur a comme vue l’interface du service web, qui se base sur un système intermédiaire repr¶-sentant le système médiateur, c’est dans cette interface que l’utilisateur peut envoyer sa requ^ete. Nous remarquons aussi qu’il peut y avoir une combinaison de services web.

Approche proposée

Bien que notre cadre global soit concern¶ par deux phases (l’indexation et l’inter-rogation moyennant des services web), notre étude se focalisera essentiellement sur le premier aspect. En efiet, la phase d’indexation, étant en amont de l’interrogation, est au c¾ ¾ur de notre approche et en constitue l’élément premier pour la combinaison de difiérents services web pour l’évaluation d’une requ^ete.
Notre objectif est de proposer des techniques d’indexation sémantique et de spécifler sous forme de services Web une interface permettant l’exploitation des index séman-tiques proposés.
Le schéma de la Figure 3.2 représente l’approche proposée.
Fig. 3.2: Approche proposée
Sur le schéma de la flgure précédente 3.2, nous remarquons que la phase d’indexation se réalise en deux traitements, selon le type de la source de données (sources de données hétérogènes) :
{ Premier traitement : indexation faite automatiquement et concerne les sources textuelles (documents).
{ Deuxième traitement : indexation faite d’une manière manuelle (des annotations faites par des humains) et concerne les sources non textuelles.
Les services web d’indexation considérés de ce travail concernent difiérents index issus de l’indexation faite préalablement. Nous distinguons notamment deux type index :
{ index manuel = index issu des annotations de documents non textuels.
{ index automatique = index issu d’une indexation automatique syntaxique et sé-mantique des documents textuels.
Ces services web d’indexation peuvent ^etre intégrés et combinés avec d’autres services web d’interrogation (concernant les sources de données structurées) de l’architecture

Ontologie de mediation

globale, afln de trouver les sources de données pertinentes qui répondent µa une requete donnée. Les réponses partielles obtenues par ces services sont combinées pour délivrer une réponse globale. Il est µa noter que ces aspects concernant la réécriture de requetes afln de d’obtenir une combinaison de résultats satisfaisant au plus une requete ne sont pas traités dans ce travail de recherche. Il sont traité dans le cadre d’un sujet de master recherche commencé parallèlement a notre travail.
Comme nous l’avons déja mentionné, notre indexation s’inscrit dans le cadre d’une approche d’intégration de données par médiation [21]. Dans une telle approche, il est courant de déflnir, conceptuellement et de manière centralisée, un schéma global ou une ontologie regroupant l’ensemble des prédicats modélisant le domaine d’application du système médiateur. Dans notre cas qui est le domaine médical et afln de soutenir l’intégration des données des difiérentes sources, l’utilisateur posera ses requetes dans les termes du vocabulaire structuré du domaine médical fourni par l’ontologie représentant l’ensemble des termes modélisés et utilisés par les difiérentes sources intégrées.
Le r^ole de cette ontologie est d’établir la connexion entre les difiérentes sources ac-cessibles en se fondant sur la déflnition de vues abstraites décrivant de fa»con homogène et uniforme le contenu des sources d’informations en termes des concepts de l’ontologie. Les sources d’informations pertinentes, pour l’évaluation d’une requ^ete, sont calculées par réécriture de la requ^ete en termes de ces vues (partie interrogation). Parmi ces vues, les services web d’indexation que nous allons proposer peuvent etre utilisés.
Un exemple d’ontologie médicale de médiation
Afln de montrer un scénario global dans lequel nous allons exemplifler notre approche d’indexation µa base de services web, nous présenteront dans un premier temps le schéma global décrivant l’ontologie de notre système (Figure 3.3).
Fig. 3.3: Ontologie de médiation proposée
L’usage d’une ontologie lors de la phase d’indexation permet de rendre un certain nombre de services dont le plus important est la levée des ambigu˜‡tés des sens des termes utilisés pour l’indexation. L’usage d’une ontologie permet aussi une meilleure représentation des connaissances contenues dans les documents. En termes d’indexation sémantique, les concepts de l’ontologie sont associés µa chaque document selon les sémantiques qui y sont véhiculées. Ainsi, en plus de lier les documents µa des termes pondérés comme dans les approches classiques [22], ces documents sont liés µa des termes interconnectés faisant partie d’une ontologie oµu les relations disposent d’une sémantique claire et non ambigue (synonymie, équivalence, relation hiérarchiques, etc.). Dans cet exemple (Figure 3.3), notre ontologie du domaine d’application a et défflnie comme un ensemble de classes, et chaque classe dispose de :
{ propriétés, e.g. la classe Service a un code de service (propriété : hasCodeS).
{ sous-classes, e.g. le lien (rdfs:subClass) entre la classe Doctor et la classe Medical_Manpower signiflant que la classe Doctor est sous-classe de la classe
Medical_Manpower.
Une classe peut ^etre également liée µa une ou plusieurs classes, e.g. Report est fourni par un médecin Doctor et concerne un patient.
Afln de présenter les services Web pour l’indexation, nous allons présenter dans un premier temps les services web permettant l’interrogation des données dans le système de médiation. Ceci est nécessaire pour garder une cohérence notamment lorsque la réponse µa une requete doit etre fondée sur des services d’interrogation. Ces services d’interrogation doivent prendre en compte les caractéristiques de l’indexation pour permettre une future réécriture des requetes et une combinaison des résultats.
Les différents services d’interrogation et d’indexation, seront décris par des vues RDF µa partir de l’ontologie de médiation.

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *