Ontologie ou Ressource Termino-Ontologique ?
La notion d’ontologie est utilisée dans le domaine de l’Intelligence Artificielle, et plus précisément dans la branche de l’Ingénierie des Connaissances, pour la conception des systèmes à base de connaissances.
Une définition consensuelle utilisée dans la littérature en Intelligence Artificielle est celle de (Gruber, 1993) : «Une ontologie est une spécification explicite d’une conceptualisation.» Le terme « conceptualisation » situe les ontologies au niveau sémantique. Elle pose ainsi le sens des termes utilisés et fortement corrélés au domaine considéré. La caractérisation du sens des termes dépend du contexte dans lequel ils apparaissent. En effet, la linguistique est concernée par la question des ontologies dans la mesure où les données dont on dispose pour élaborer les ontologies consistent en des expressions linguistiques de connaissances. Nous parlons alors d’ontologie élaborée pour une tâche donnée et dans un contexte de référence (Bachimont, 2000). L’expression « spécification explicite » fait des ontologies un objet syntaxique. La conceptualisation est faite dans un langage formel qui définit les concepts et les contraintes d’utilisation. On obtient un réseau sémantique et un ensemble de formules logiques sous-jacentes.
La construction du vocabulaire conceptuel standardisé est établie en définissant un ensemble de primitives de représentation pour modéliser le domaine. En OWL, les primitives d’une ontologie sont (Guarino et al., 2009) :
– les concepts de l’ontologie sous forme de owl :Class,
– les attributs de concepts sous forme de owl :DatatypeProperty,
– les relations binaires entre concepts sous forme de owl :ObjectProperty.
OWL a été élaboré dans l’optique de l’indexation de ressources sur le Web. Il permet donc de représenter le lexique sous la forme duquel un concept pourra apparaître dans un document. La modélisation des termes désignant le concept dans le langage OWL se fait par association du terme à la classe correspondante au moyen d’une propriété d’annotation, rdfs :label. Cette modélisation limitée pose plusieurs problématiques, en particulier pour le domaine de recherche s’intéressant à l’extraction et à l’annotation des données dans les documents textuels. En effet, un terme ainsi représenté n’a pas d’existence propre, on ne peut pas lui associer directement de propriétés, e.g. une étiquette grammaticale. Le terme est relié au concept qu’il désigne et de ce fait, la dissociation des informations conceptuelles et lexicales est impossible.
La nécessité de matérialiser la notion de terme, de manière à pouvoir la manier aussi aisément qu’un concept, est apparue à partir des travaux de (Reymonet et al., 2007; AussenacGilles et al., 2006) avec la naissance de la notion de Ressource Termino Ontologique (RTO). Dans cette nouvelle modélisation, la manifestation linguistique (le terme) est dissociée de la notion qu’elle dénote (le concept), en la représentant et en lui octroyant une existence propre et indépendante.
Ceci peut être fait en utilisant SKOS comme proposé dans les travaux de (Touhami et al., 2011). SKOS, Simple Knowledge Organisation System, est une recommandation du W3C 1 permettant de représenter les thésaurus, classifications et autres vocabulaires contrôlés. SKOS s’appuie sur le langage RDF afin de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du web sémantique. La représentation s’établit sous forme de triplets RDF tels que la ressource de base est un skos :Concept. Plusieurs propriétés sont octroyées à un objet de type skos :Concept :
• des termes préférés (un maximum par langue) en utilisant le skos :prefLabel,
• des termes alternatifs qui vont représenter les synonymes ou les abréviations (plusieurs par langue) en utilisant le skos :altLabel,
• des termes cachés pour gérer les variantes correspondant à des fautes d’orthographe courantes en utilisant le skos :hiddenLabel,
• d’autres propriétés permettent de poser des définitions, des notes et des exemples.
Les instances de skos :Concept peuvent être reliées par des relations de spécialisation ou par des relations associatives, i.e. skos :related. SKOS-XL, SKOS eXtension for Labels, est une extension de SKOS qui permet de représenter plus finement les termes en proposant la représentation des relations entre les différentes formes lexicales, e.g. relation d’acronymie. Cette représentation est particulièrement intéressante, dans le cadre de la RTO, car elle permet de considérer les termes comme une ressource à part entière, avec la propriété skosxl :Label.
Dans le cadre de la thèse, le travail repose sur une modélisation en RTO dédiée à la représentation des relations n-aires, où composante conceptuelle et terminologique sont clairement dissociées. Cette RTO est présentée dans la section 2.2. Dans la suite du manuscrit, nous utilisons indifféremment les termes Ontologie et RTO en sous-entendant la notion de RTO.
1 Introduction |