Survol de la littérature sur les noms composés en grec moderne
Un nombre important de travaux ont été consacrés à la composition lexicale (ou morphologique) en général, et plus particulièrement à la composition nominale du grec moderne. Dans ce sous-chapitre, nous citons les travaux les plus significatifs qui ont été effectués dans le cadre de l’approche linguistique et qui servent aujourd’hui de référence pour la plupart des études portant sur la composition nominale en grec moderne. Plusieurs auteurs ont déjà proposé des survols des travaux sur les noms composés en grec moderne notamment dans le cadre de l’approche linguistique (ou symbolique) (cf. Z. Gavriilidou 1997, A. Anastassiadis-Syméonidis 2004). Dans cette section, nous ne reprenons que les principales étapes de la réflexion sur la composition en grec moderne. Nous décrivons les principes qui régissent la composition nominale du grec moderne et nous présentons une typologie de classification. Il faut rappeler que la langue grecque dans son état actuel comprend le grec populaire (ou la démotique12) ainsi que des résidus du grec ancien et du grec savant (ou katharevoussa13), ce que G. Gross (1996a : 22) appelle des « blocs erratiques », c’est-à-dire « des éléments ou constructions qui remontent à un état de langue antérieur ».
La somme des trois constitue ce qu’on appelle largement le grec moderne. Malgré le fait que la démotique est depuis plus de 30 ans la langue officielle en Grèce, des résidus de la langue savante et du grec ancien persistent, ce qui rend le grec une langue riche en variantes et en mots composés. Contrairement à la grande diversité des critères de définition concernant la composition nominale en français (cf. I, 1.2), en grec moderne, les noms composés sont essentiellement définis sur la base de critères morphologiques (Z. Gavriilidou 1997). Cependant, les linguistes et les grammairiens grecs se servent également d’un certain nombre de critères syntaxiques et sémantiques afin de définir les noms composés non-soudés, qui sont désignés sous différentes appellations, à savoir : noms phrastiques14 (Ch. Clairis et G. Babiniotis 1996), combinaisons figées15 ou noms composés juxtaposés lâches16 (D. Holton ; P. Mackridge et I. PhilippakiWarburton 200017), noms composés lâches18 (A. Tsopanakis 1994), noms composés polylexicaux lâches19 (A. Ralli 2004).
Classification des noms composés en grec moderne
En ce qui concerne le grec moderne et pour ce qui est des auteurs précités (cf. Ch. Clairis et G. Babiniotis 1996, A. Ralli 2004, T. Kyriacopoulou et al. 2002), la classification des noms composés est le plus souvent fondée sur leur structure lexicale interne. Elle concerne uniquement les noms composés binaires et elle ne contient pas les noms composés de toutes les structures morphosyntaxiques (sauf dans T. Kyriacopoulou et al. 2002). Par exemple, les noms composés de structure Nom + Préposition + Nom; tels que άδεια άνευ αποδοχών/congés non-payés, n’y figurent pas. Ci-dessous les classes que l’on y retrouve : 38 Structures morphosyntaxiques Exemples Adjectif + Nom ψυχρός πόλεµος/guerre froide τρίτος κόσµος/tiers monde Nom + Nom au génitif άρµα µάχης/char de combat ζώνη ασφαλείας/ceinture de sécurité Nom + Nom33 νόµος πλαίσιο/loi-cadre λέξη κλειδί/mot-clé Pour ce qui est de notre recherche, la classification des noms composés que nous proposons est également fondée sur leur structure lexicale interne. Nous prenons en compte non seulement les noms composés binaires, mais aussi leurs expansions, c’est-à-dire les noms composés complexes (ou surcomposés) (e.g. N A:G N:G=: φόρος προστιθέµενης αξίας/taxe sur la valeur ajoutée). Nous reviendrons plus en détail sur la classification que nous adoptons dans II, 3.2. Dans le cadre de cette étude, nous adoptons la définition formelle mise au point par M. Silberztein (1990), selon laquelle nous distinguons les mots simples, qui sont des séquences de lettres comprises entre deux séparateurs, et les mots composés, qui sont des séquences incluant au moins deux mots simples et donc au moins un séparateur. Les séparateurs en grec moderne sont le blanc, le trait d’union, la virgule de laison et l’apostrophe.
Nous considérons donc les noms composés soudés comme des mots simples, puisque leur traitement automatique est identique à celui des mots simples. Nous n’examinons ici que les noms composés non-soudés ou multi-mots. Nous adoptons également la dichotomie terminologique proposée par Z. Gavriilidou (1997 : 22) : « les notions de composition (qui concerne la forme) et de figement (qui concerne la syntaxe interne et la sémantique du composé) sont bien distinctes en grec ». Nous tenons à préciser que dans le cadre de la présente étude, dont le but est de fournir des ressources 33 A. Ralli (2004 : 199) n’inclut pas les noms composés Nom + Nom dans la typologie qu’elle propose car elle estime qu’il n’y a pas suffisamment d’indices pour qu’ils soient considérés des « noms composés polylexicaux lâches ». 39 lexicales qui seront utilisées à l’analyse automatique des textes, les définitions que nous utilisons sont motivées par le souci de l’exploitation informatique des données. Nous adoptons aussi la position de G. Gross (1996a : 48), qui souligne : « dès lors qu’on envisage la composition nominale comme un phénomène qui affecte les groupes nominaux, une première constatation s’impose : si l’on veut décrire ce phénomène de façon intégrée et reproductible, il est impossible de se contenter d’observations générales sur le figement, indépendamment de la nature de la structure interne des noms composés. En effet, pour reconnaître automatiquement les noms composés, il faut être en mesure d’en montrer les limites et prédire leur morphologie (pour le français : formation du pluriel et éventuellement du féminin), et établir au préalable une typologie de la composition, afin de percevoir les problèmes spécifiques à chaque type. En fonction de la structure interne des noms composés, les éléments de la description varient. Selon que la structure interne du mot composé correspond ou non à la structure canonique des groupes nominaux, les indications requises ne sont pas les mêmes. La reconnaissance automatique comme unité figée d’une structure hétérogène dans un texte est évidente, ce qui n’est pas le cas d’une structure canonique ».