La relation d’expansion classifiante
Cette relation, que l’on appelle aussi relation de classifieur [Jonasson, 1994] associe à chaque prolexème une expansion. Un nom propre apparaît régulièrement dans les textes journalistiques, quelle que soit la langue, accompagné d’expansions se trouvant soit à sa gauche, soit à sa droite. Toutes les expansions qui existent dans une langue ne se retrouvent pas forcément dans une autre langue. Par exemple, le français distingue l’expansion rivière et fleuve pour le nom d’un cours d’eau alors que l’anglais utilise seulement l’expansion river. La traduction des expansions peut parfois poser quelques problèmes. Par exemple, la traduction de Rechtsanwalt Paul Bischof (allemand) ne donne pas en français Avocat Paul Bischof, mais plutôt Maître Paul Bischof. Si l’expansion d’un nom propre est omise dans un texte, il est parfois nécessaire de la rétablir lors de la traduction de celui-ci, afin d’apporter un complément d’information au lecteur. Ainsi, le nom propre la Loire deviendrait en anglais the Loire River. Nous avons prévu d’associer aux expansions classifiantes des liens vers des descriptions syntaxiques (grammaires locales [Gross, 1989]) ou sémantiques (les classes d’objets [Le Pesant and Mathieu-Colas, 1998], EuroWordNet, Framenet [Fillmore et al., 2003]). Prenons l’exemple de l’expansion écrivain, on pourra lui associer : 1. la Frame Text_creation (figure 3.7) 2. la grammaire locale de la figure 3.8 3. le concept writer dont le numéro ILI est 06438760n (figure 3.9) 4. la classe d’objet correspondante. En français, quelques noms propres, tels que les toponymes, se construisent dans une phrase avec des prépositions locatives [Constant, 2003] : à, dans, en, sur, etc. Nous avons aussi envisagé d’intégrer ces informations sous forme de grammaires locales. 3.3.5 L’éponymie La relation d’éponymie se compose de trois relations : l’antonomase, le figement et la terminologie. Contrairement aux autres relations, l’objectif de la relation d’éponymie est d’empêcher une reconnaissance abusive des noms propres dans des textes. Par exemple, la loi Pasqua devra être reconnue comme terme mais pas Pasqua tout seul. L’antonomase L’antonomase est une figure de rhétorique par laquelle un nom propre est remplacé par un nom commun ou inversement. Nous avons pris en compte uniquement, dans le cadre de la relation d’antonomase, les antonomases à partir d’un nom propre. Un nom propre employé en tant qu’antonomase perd la plupart du temps, dans le cas du français, sa majuscule initiale, surtout quand le lien qui l’unit au nom propre originel tend à s’effacer : une mégère = une femme violente un bic = un stylo-bille un kleenex = un mouchoir en papier.
Le figement
Pour le dictionnaire anglais Cobuild Dictionary of Idioms, les idiomes sont définis de la façon suivante : An idiom is a special kind of phrase. It is a group of words which have a different meaning when used together from the one it would have if the meaning of each word were taken individually. […] Idioms are typically metaphorical : they are effectively metaphors which have become ’fixed’ or ’fossilized’.Nous définissons le figement comme des tournures idiomatiques construites à partir d’un ou plusieurs noms propres. Certaines tournures idiomatiques comprenant un nom propre dans une langue donnée peuvent se traduire vers une autre langue à l’aide d’une autre tournure idiomatique pouvant ne pas comporter de nom propre. C’est le cas des exemples suivants : être en tenue d’Adam = to be in one’s birthday suit not for all the tea in China = pour rien au monde I don’t know him from Adam = je ne le connais ni d’Ève ni d’Adam (Dictionnaire Hachette-Oxford) Le sens d’un figement peut varier d’une langue vers une autre : zwischen Scylla und Charybdis [sein] = être entre deux dangers (d’après Duden 11 / Redewendungen) (tomber) de Charybde en Scylla = quitter un mal pour un autre pire encore (Petit Larousse)
La terminologie
On retrouve de nombreux noms propres dans les terminologies scientifiques (le théorème d’al-Kashi sur le calcul des longueurs des côtés d’un triangle non rectangle, les équations de Maxwell qui caractérisent les interactions entre charges, etc.), juridiques (la loi Evin relative à la lutte contre le tabagisme et l’alcoolisme, la loi de Robien sur l’investissement locatif, etc.) ou médicales (la maladie de Creutzfeldt-Jakob, la maladie de Parkinson, etc.). Nous n’avons pas intégré ces termes dans la classe des noms propres, car ils appartiennent plus à une langue spécialisée qu’à la langue générale. De plus, leur traduction, loin d’être triviale, nécessite parfois l’utilisation d’une expression définie. Par exemple, la loi Pasqua ne se traduira pas en allemand par Pasqua-Gesetz mais plutôt par französisches Einwanderungs-und Staatsangehörigkeitsgesetz. Quelques fois, on sera amené à traduire un nom propre par son dérivé : le théorème de Pythagore = der pythagoreische Lehrsatz la maladie de Parkinson = die parkinsonsche Krankheit D’une langue à l’autre, les noms propres utilisés dans une terminologie peuvent être sujets à des variations : Comme nous l’avons montré, les noms propres utilisés dans les termes médicaux peuvent être composés, notamment reliés par un trait d’union, et l’ordre de composition des noms propres pour un même terme peut varier d’une langue à l’autre 71 (« maladie de Legg-Perthes-Calvé » ; « Legg-Perthes-Calvé disease » ; « Perthes-LeggCalvé-Krankheit »). [Bodenreider and Zweigenbaum, 2000b] Finally, compound proper names found in different translations of ICD-10 sometimes show variation in the order or even in the number of the names (e.g. an alternate term for « relapsing panniculitis » is « Weber-Christian disease » in English, « maladie de Weber-Christian » in French, but « Pfeifer-Weber-ChristianKrankheit » in German). [Bodenreider and Zweigenbaum, 2000a]
Représentation sous forme d’un schéma
Nous représentons les différents concepts du domaine des noms propres sous la forme d’une arborescence (figure 3.10) qui peut se décomposer en deux niveaux : un niveau indépendant des langues et un niveau dépendant de la langue. Le niveau indépendant de la langue est lui-même composé de deux niveaux. Le premier niveau, que l’on appelle le niveau méta-conceptuel, comprend les types et l’existence (voir chapitre suivant). Le deuxième niveau est le niveau conceptuel, qui inclut le concept de nom propre conceptuel et les relations de méronymie, de synonymie et d’accessibilité. Le niveau dépendant de la langue est aussi subdivisé en deux niveaux différents : le niveau linguistique et le niveau des instances. Le niveau linguistique englobe les concepts de prolexème, d’alias et de dérivé. Chaque langue possédera sa propre arborescence à partir de la forme canonique d’un nom propre, ou prolexème, qui sera relié à un même niveau indépendant de la langue à travers un ensemble de noms propres conceptuels. En raison des grandes divergences et de la complexité des mécanismes s’appliquant sur les noms propres,nous ne pouvons définir une arborescence générale qui pourrait s’appliquer pour toutes les langues. Selon la langue, cette arborescence pourra être plus ou moins complexe. La figure 3.11 présente l’arborescence du prolexème français et la figure 3.12 l’arborescence plus complexe du prolexème serbe. Le niveau des instances regroupe toutes les formes fléchies que l’on peut obtenir en appliquant des règles morphologiques, plus ou moins compliquées selon les langues, sur un nom propre. L’ensemble de ces formes fléchies, qui correspondent aux mots que l’on retrouve dans un texte, forme ce que [Polguère, 2003] appelle les lexies d’un nom propre : Une lexie, aussi appelée unité lexicale, est un regroupement 1) de mots-formes ou 2) de constructions linguistiques qui ne se distinguent que par la flexion. La figure 3.13 montre l’exemple détaillé du nom propre Belgrade en cyrilique serbe. La figure 3.14 détaille les prolexèmes français Suisse et Confédération helvétique.