Choix du lexique et Aspects morphologiques

Choix du lexique et Aspects morphologiques

Nous avons commencé par une inspection minutieuse de quelques dictionnaires importants en coréen pour obtenir une liste de verbes exhaustive. Nous avons examiné trois dictionnaires imprimés, Saeulimal Keun Sajeon (Nouveau Dictionniare de la langue coréenne, 1990), Yeonsei Hangugeo Sajeon (Dictionnaire Yeonsei de la langue coréen, 1998) et Pyojun Gugeo Daesajeon (Grand Dictionnaire du Coréen standard, 1999) 2 . Le premier succède aux dictionnaires traditionnels antérieurs, alors que le deuxième est un dictionnaire contenant des exemples se fondant sur un corpus de textes écrits à l’origine en coréen. Le troisième est un dictionnaire qui non seulement fait la synthèse des deux précédents mais aussi prend en compte la langue de la Corée du Nord. Ces deux derniers dictionnaires présentent des exemples naturels et les structures casuelles, différemment des dictionnaires traditionnels. Cependant, ils ne fournissent pas de données fiables pour certains types de verbes.  Premièrement, il s’agit des verbes onomatopéiques (Cf. I.3.3). Ils sont caractérisés par une structure formelle comportant une répétition, des variations morphologiques ou phonologiques, et des types de suffixes qui peuvent leur être combinés. Mais les dictionnaires mentionnés ci-dessus ne contiennent pas ces verbes exhaustivement, surtout les verbes comportant les onomatopées répétées comme Deuxièmement, il est fait mention des verbes qui sont dérivés des noms prédicatifs par combinaison avec les suffixes -hada et -doida. Ces verbes sont très importants par leur quantité et leur fréquence d’emploi en coréen.

Le travail de recensement de ces verbes exige un examen minutieux des noms prédicatifs, parce que certains peuvent se combiner avec les où la forme galdeungdoida (= hésiter) a été oubliée. Cela concerne un point sur quoi les dictionnaires basés sur un corpus devront être complétés : les travaux sur les données qui se trouvent être absentes du corpus utilisé mais peuvent être pratiquement utilisées. Troisièmement, il s’agit des verbes dérivés d’adjectifs. On a deux types de tels verbes selon la forme des suffixes -(eo)jida et -(eo)hada. La plupart des adjectifs peuvent être combinés avec un de ces deux suffixes. Cependant on ne trouve qu‘une partie des verbes dérivés d’adjectifs dans les dictionnaires actuels : les verbes 넓어지다 (neolb-eojida, élargir) et Troisièmement, il s’agit des verbes dérivés d’adjectifs. On a deux types de tels verbes selon la forme des suffixes -(eo)jida et -(eo)hada. La plupart des adjectifs peuvent être combinés avec un de ces deux suffixes. Cependant on ne trouve qu‘une partie des verbes dérivés d’adjectifs dans les dictionnaires actuels : les verbes 넓어지다 (neolb-eojida, élargir) et électronique SEJONG 2007)4. Ce dictionnaire se constitue en 5 sous-dictionnaires : ceux des substantifs, prédicats (verbes et adjectifs), noms composés, expressions figées et mots spéciaux. En ce qui concerne le sous-dictionnaire des prédicats, il contient environ 30,000 entrées : 23,300 verbes et 6,300 adjectifs. Il donne des informations morphologique, syntaxiques et sémantiques par sens pour les études linguistiques. Cependant, on ne peut pas dire que ces entrées soient nombreuses parce que les syntagmes verbaux (N+V) à sens figuré qui peuvent se réaliser sans espace, par exemple 귀빠지다 (gui-bbajida, oreille-sortir, casser, détruire), sont compris dans la liste des verbes. Enfin, ce dictionnaire ne fournit pas toujours de données fiables pour les mêmes raisons que les dictionnairs imprimés.

Les dictionnaires DECO sont construits pour le traitement automatique des textes en coréen. Ils se constituent en 4 dictionnaires : de noms (DECO-NS), de verbes (DECO-VS), d’adjectifs (DECO-AS) et d’adverbes (DECO-DS). Les données du DECO-VS s’élèvent à environ 27,000 en ce moment, à la suite du travail permanent d’ajout des entrées omises6. En ce moment, les entrées lexicales dans DECO-VS portent des codes qui donnent des informations sur la classe de conjugaison, l’existence et la forme d’un élément morphologique, la catégorie grammaticale de la base dérivationnelle, etc. Le tableau suivant montre une partie des données du DECO-VS. Ce dictionnaire doit être distingué d’autres dictionnaires actuels pour plusieurs raisons. Premièrement, les données sont complétées par l’intuition des linguistes et par consultation des autres dictionnaires du système DECO pour obtenir des listes exhaustives. Prenons l’exemple des verbes onomatopéiques. Presque toutes les onomatopées peuvent être répétées et combinées aves les 4 types de suffixes -daeda, -geolida, -ida, et -hada. La possibilité de répétition et de combinaison avec ces suffixes est cependant considérée séparément par rapport à chaque adverbe onomatopéique. En ce qui concerne la liste des adverbes onomatopéiques, nous avons consulté DECO-DS. Il en est de même pour les verbes dérivés des noms et des adjectifs. Deuxièmement, la couverture de DECO-VS est excellente dans la mesure où il contient 27,000 verbes sans compter les verbes composés (V+V) ou les syntagmes verbaux (N+V). Les listes partielles de verbes sélectionnées par fréquence d’emploi peuvent souvent provoquer des difficultés dans l’utilisation pratique des données. Troisièmement, les verbes dans DECO-VS ont des codes de conjugaison et peuvent être associés automatiquement aux suffixes appropriés en utilisant ces codes, par exemple avec le système Unitex. On peut ainsi obtenir la liste des formes conjuguées d’un verbe donné. Les dictionnaires imprimés et le Dictionnaire électronique SEJONG (2007) n’ont pas d’information sur les formes de de conjugaison dans leur version actuelle. A cause de ces faits, nous avons choisi le DECO-VS qui nous fournit les données les plus fiables.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *