Conception & Structure de WordNet

Cours ontologie WordNet Modèle de notre axe de recherche , tutoriel & guide de travaux pratiques en pdf.

Conception & Structure de WordNet

On peut considérer WordNet comme un graphe ou un réseau sémantique, souvent qu’on qualifie d’ontologie légère (Light Ontology), ou chaque nœud représente un concept du monde réel. La conception de WordNet est basée sur les théories de la représentation des connaissances mentales : mémorisation des mots et concepts d’une manière hiérarchique, en utilisant la relation d’inclusion (qui lie, par exemple, des triplets comme «animal », « oiseau», et « Chardonnet »). [COL98]
Exemple :
Un concept peut être un objet tel que « Car » une entité tel que « Teacher » ou un concept abstrait tel que « art ». Chaque nœud est constitué d’un ensemble de mots, où chacun représente le concept associé à ce nœud. Un nœud peut être vu comme un ensemble de mots dont chacun représente le même concept.
Exemple :
Le concept « car » est représenté par l’ensemble de mots {car, auto, automobile, motocar}.
Dans la terminologie de WordNet cet ensemble est appelé est nommé « Synset ». WordNet offre des descriptions détaillées et précises des mots. Leur structuration sur un axe ontologique a un fondement psychologique. Il résulte de cette approche qu’il arrive parfois que l’on rencontre plus de 20 sens pour un verbe, par exemple le verbe « give » a 27 sens.

SynSet

WordNet manipule les unités lexicales non pas par des mots mais par un ensemble de synonymes ou « Synset », groupes de mots ou de phrases qui expriment le même concept. Des différences de sens entre les membres d’un «Synset» se montrent dans différentes restrictions de sélection. Par exemple, « rise » (monter) et « fall » (tomber / descendre) peuvent choisir comme argument des entités abstraites comme « temperature » (température) et « prices » (prix).
Un « Synset » est accompagné d’une petite définition dite « gloss » qui décrit un concept du monde réel.
Exemple : les nœuds suivant correspondent aux différents sens de « mouse » dans WordNet :
1. Mouse — (any of numerous small rodents typically resembling diminutive rats having pointed snouts and small ears on elongated bodies with slender usually hairless tails)
2. Shiner, black eye, mouse — (a swollen bruise caused by a blow to the eye)
3. Mouse — (person who is quiet or timid)
4. Mouse, computer mouse — (a hand-operated electronic device that controls the coordinates of a cursor on your computer screen as you move it around on a pad ; on the bottom of the device is a ball that rolls on the surface of the pad ; « a mouse takes much more room than a trackball »)
5. Sneak, mouse, creep, pussyfoot — (to go stealthily or furtively; « …stead of sneaking around spying on the neighbour’s house »)
6. Mouse — (manipulate the mouse of a computer)
Notons que WordNet met l’accent sur les liaisons entre les « Synset » (arc du graphe de la Figure 29) pour marquer sa valeur ajoutée faces aux dictionnaires traditionnaires. Chaque lien décrit une relation entre concept du monde réel. Par exemple, les relations telles que : « a spoke is a part of a wheel » ou « a vehicle is a kind of conveyance »
Fig. 29 : Exemple de sous hiérarchie dans WordNet correspondent au concept « car ». [BAZ05]

Organisation

WordNet sépare les données en quatre (04) bases de données, organisées différemment les unes des autres, associées aux catégories de noms, verbes, adjectifs et adverbes. Les noms et verbes sont organisés en hiérarchies. Des relations d’hyperonymie («est-un») et d’hyponymie relient les « ancêtres » des noms et des verbes avec leurs «spécialisations ». Au niveau racine, ces hiérarchies sont organisées en types de base. [FEL98] Le réseau des noms est bien plus profond que les autres parties. Il faut noter que, les deux premiers niveaux de la hiérarchie des noms se constituent des concepts abstraits suivants :
• ABSTRACTION: ATTRIBUTE, MEASURE/QUANTITY/AMOUNT, RELATION, SET, SPACE, TIME…
• HUMAN ACTION: ACTIVITY, COMMUNICATION, DISTRIBUTION, INACTIVITY, JUDGMENT, LEANING, LEGITIMATION, MOTIVATION, PROCLAMATION, PRODUCTION, SPEECH ACT… ENTITY: ANTICIPATION, CAUSAL AGENT, ENCLOSURE, EXPANSE, LOCATION, PHYSICAL OBJECT, SKY, SUBSTANCE, THING…
• EVENT: GROUP ACTION, NATURAL EVENT, MIGHT-HAVE-BEEN, MIGRATION, MIRACLE, NONEVENT, SOCIAL EVENT…
• GROUP, GROUPING: ASSOCIATION, BIOLOGICAL GROUP, PEOPLE, COLLECTION, AGGREGATION, COMMUNITY, ETHNIC GROUP, KINGDOM, MULTITUDE, POPULATION, RACE, RARE-EARTH ELEMENT…
• PHENOMENON: EFFECT/RESULT, LEVITATION, FORTUNE/CHANCE, REBIRTH, NATURAL PHENOMENON, PROCESS, PULSATION…
• POSSESSION: ASSETS, CIRCUMSTANCES, PROPERTY/MATERIAL POSSESSION, TRANSFERRED PROPERTY, TREASURE…
• PSYCHOLOGICAL FEATURE: COGNITION/KNOWLEDGE, FEELING, MOTIVATION/NEED…
• STATE: ACTION/ACTIVITY, EXISTENCE, STATE OF MIND, CONDITION, CONFLICT, DAMNATION, DEATH, DEGREE, DEPENDENCY, DISORDER, EMPLOYMENT, END, FREEDOM, ANTAGONISM, IMMATURITY, IMMINENCE, IMPERFECTION, INTEGRITY, MATURITY, OMNIPOTENCE, PERFECTION, PHYSIOLOGICAL STATE, RELATIONSHIP, STATE OF AFFAIRS, STATUS, TEMPORARY STATE, NATURAL STATE…
WordNet organisent les verbes en taxonomie. Plusieurs propriétés des verbes dépendent de la manière avec laquelle on peut combiner les arguments (sujet, objets direct, objets indirects) [WID04].
Notamment qu’elle relation utilise t – on ? « is a kind of » ?, WordNet fournit une relation équivalente à celle–ci c’est la relation « Manner Of » nommée : « Troponymy »
Les adjectifs et les adverbes sont organisés de paires d’antonymes1 tels que « good, bad ». Bon nombre d’adjectifs en langue anglaise possède des antonymes, par opposition aux verbes et aux noms. Les adverbes sont souvent définis par les adjectifs dont ils dérivent. C’est ainsi ils héritent de la structure des adjectifs.

La matrice lexicale

Un sens peut être représenté par plusieurs mots.
Et un mot à son tour peut désigner plusieurs sens.
Exemple : le mot « word » fait référence en même temps
à une expression et à un concept. Pour éliminer cette ambiguïté : « word form » sera utilisé pour exprimer (la forme ou l’image) et « word meaning » sera utilisé dénoter le concept que porte ce mot « word ». [FEL98]
Dans la matrice lexicale (voir à droite), une entrée dans la cellule de la matrice Eij, suppose le « word form » Fi est utilisée pour référencer le concept « word meaning » (concept) Mj. [FEL98]

LIRE AUSSI :  Les réseaux de mobiles

Les relations dans WordNet

Deux relations fondamentales interviennent dans WordNet, notamment celle entre les « word form » appelés relations lexicales (par exemple : la synonymie), et celle qui associent les « word meaning » appelés relation sémantiques (par exemple : l’hyperonymie).
Remarquons que la majorité des relations dans WordNet sont des « synset » de la même catégorie, excepté les relations « pertains to » et « attribute » souvent utilisées entre les adjectifs et les noms. Le tableau 2 illustre un sous ensemble des relations dans WordNet qu’on détaillera par la suite.
Voilà, une définition des relations les plus importantes dans WordNet :

Synonymie

La synonymie est une relation liant deux concepts équivalents ou voisins (frêle / fragile). Il s’agit d’une relation symétrique. Christiane Fellbaum, dans [FEL98], énonce une définition, généralement attribuée à Leibniz, « two expressions are synonymous if the substitution of one for the other never changes the truth value of a sentence in which the substitution is made. » Ce qui ce traduit par : Deux expressions sont synonymes dans un contexte linguistique C, si la substitution de l’une pour l’autre en C, ne modifie pas la valeur de vérité de la phrase dans laquelle la substitution soit faite. Par exemple, la substitution « a 60 plank » pour « a board » groupé dans un même Synset {board, plank}, sera rarement substituer dans des contextes de menuiserie, bien qu’il y ait d’autres contextes comme un conseil d’administration où cette substitution serait totalement inapproprié. [FEL98]

Antonymie

Une autre relation familière est l’antonymie, qui s’avère être étonnamment difficile de définir. L’antonyme d’un mot « X » n’est pas toujours « Non X ». Par exemple, « riche » et « pauvre » sont des antonymes, mais de dire que quelqu’un n’est pas riche ne signifie pas qu’il doit être pauvre, de nombreuses personnes ne se considèrent ni riche ni pauvre. L’Antonymie, semble être une simple relation symétrique, mais elle est en faite assez complexe, et beaucoup de personnes trouvent des difficultés à reconnaître les antonymes quand ils les voient. [FEL98] Antonymie n’est pas une relation sémantique entre « word meanings » mais beaucoup plus une relation lexicale entre « word forms ». Par exemple, la signification {rise, descend} – (s’élever/descendre) et {fall, ascend} – (monter/tomber) peuvent être conceptuellement opposées, mais ils ne sont pas des antonymes; [rise, fall] sont des antonymes et aussi [asscend, descend]. Ces faits font ressortir la nécessité de distinguer les relations sémantiques entre les « word forms » et les relations sémantiques entre « word meaning ».

L’Hyperonymie / Hyponymie

Ce sont les relations, les plus importantes, dans notre travail. Elles représentent la relation « is a kind of» ou tout simplement la relation « is-a ».
Elles sont réservées seulement pour les catégories Nom et Verbes qui se voient organisées sous forme d’une hiérarchie comportant un seul nœud racine. Les nœuds représentant les concepts les plus généraux sont les ancêtres des nœuds représentant les concepts les plus spécifiques. On dit alors que le concept le plus général « Subsume » celui du plus spécifique.
Exemple : dans la figure 29, « Entity » est le concept le plus hiérarchique des noms c’est la racine du nœud, il subsume le concept spécifique « wheeled vehicle » qui à son tour subsume le concept « Car ».
WordNet dispose de 9 hiérarchies pour les noms et 628 pour les verbes. L’hyperonymie représente la relation permettant d’avoir les ancêtres d’un « word meanings » à l’opposé de l’hyponymie qui fournit ses descendants. On note, aussi que WordNet permet l’héritage multiple, ce qui induit qu’un concept peut avoir plusieurs hyperonymes. WordNet représente :
L’hyperonymie par le symbole : @
L’hyponymie par le symbole : ∼
Exemple : Tree @ →
Exemple : plant ∼ →
plant
Tree

Méronymie

C’est une relation liant un concept C1 à un concept C2 qui est en fait une partie de C1 (C1= Fleur / C2= Pétale), un de ses membres (Forêt / Arbre) ou une substance le constituant (vitre / verre). Donc la méronymie est interprétée de trois manières différentes :
Si X is a part of Y (Composant – Objet complet)
Si X is substance of Y (Matière – Objet)
Si X is a member of Y (Membre – collection)
Il existe d’autres relations que la relations que nous allons donner juste une bref définition, telles que :
• Métonymie (Holonymie) : relation liant un concept C1 à un concept C2 dont il est une des parties. C’est la relation inverse de la méronymie.
• Implication : relation lie un concept C1 à un concept C2 qui en découle (marcher/faire un pas).
• Causalité : relation liant un concept C1 à son effet (tuer / mourir).
• Valeur : relation liant un concept C1 (adjectif) qui est un état possible pour un concept C2 (pauvre / condition financière).
• A pour valeur : relation liant un concept C à ses valeurs (adjectifs) possibles (taille / grand). C’est la relation inverse de Valeur.
• Voir aussi : relation entre des concepts ayant une certaine affinité (froid / gelé).
• Similaire à : certains concepts adjectifs dont le sens est proche sont regroupés. Un Synset est alors désigné comme étant central au regroupement. La relation « Similaire à » lie un Synset périphérique au Synset central (moite / humide).
• Dérivé de : indique une dérivation morphologique entre le concept cible (adjectif) et le concept origine (froidement / froid).

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *