Grammaire du Français
Nous avons ainsi travaillé sur la construction d’une grammaire DRTN lexica- lisée du français en exploitant les informations de sous-catégorisation et trans- formationnelles des prédicats du français décrits dans les tables du lexique- grammaire. Notre grammaire est lexicalisée dans le sens où, pour chacun de ces éléments (verbe plein, nom ou adjectif prédicatif ou expression figée), nous décrivons explicitement dans notre grammaire l’ensemble des réalisa- tions possibles de chaque constituant syntaxique dont il peut être le noyau.Ces constituants peuvent être des phrases complètes, des propositions infini- tives, participiales, des propositions relatives dans lesquelles un élément a été extrait, des groupes nominaux complexes dont la tête est un nom prédicatif, etc.Comme nous le verrons, nous avons pu réduire la complexité d’une telle description systématique par l’écriture manuelle d’une meta-grammaire à partir de laquelle nous générons l’ensemble de ces descriptions lexicalisées en fonction du contenu des tables du lexique-grammaire.
Construction semi-automatique
Notre grammaire DRTN lexicalisée finale, qui est utilisée pour l’analyse syn- taxique, est composée de l’ensemble des grammaires spécialisées pour chacun des éléments prédicatifs que nous traitons. Cette grammaire est générée au- tomatiquement à partir d’un ensemble de meta-grammaires que nous avonsconstruites manuellement. Une meta-grammaire est composée d’un ensemble de graphes paramétrés associés à une table du lexique-grammaire. L’utili- sation des graphes paramétrés fonctionne sur le même principe que le sys- tème de génération de grammaires par graphes patrons inclus dans les lo- giciels INTEX et Unitex (même si la nomenclature est un peu différente). Ce système de graphe patron a été repris dans plusieurs travaux exploitant les tables du lexique-grammaire pour l’analyse de textes ([Senellart, 1999] [Paumier, 2003a] par exemple) ou des recherches linguistiques sur corpus [Camugli Gallardo et Blanc, 2006].
Dans le cas de notre grammaire, chaque graphe paramétré décrit un consti- tuant syntaxique de la grammaire dont le prédicat est une variable qui sera instanciée durant la phase de lexicalisation de la grammaire. Nous pouvons voir la meta-grammaire d’une table (c’est-à-dire l’ensemble des graphes as- sociés à cette table) comme la grammaire de toutes les constructions syn- taxiques de cette table, même si chaque construction n’est pas compatible avec toutes les entrées. Chaque chemin de cette grammaire est identifié par un paramètre qui réfère à la propriété qui lui correspond dans la table. Un paramètre a le format suivant : @X@, où X est l’intitulé d’une colonne de la table. Durant la phase de lexicalisation, le processus de génération de la grammaire construit pour chaque entrée de la table, une grammaire spéciali- sée dans laquelle seuls les chemins correspondant aux propriétés syntaxiques acceptées par cette entrée sont conservés. Lorsqu’une propriété identifiée par un paramètre est acceptée par l’entrée (c’est-à-dire lorsque l’intersection de la ligne et de la colonne considérées contient un +), le paramètre est rem- placé par la chaîne vide dans le grammaire générée. La chaîne vide assure la continuation du chemin dans l’automate et donc que la construction est conservée. Quand la propriété n’est pas acceptée, la transition est supprimée de la grammaire ce qui a pour effet de bloquer l’ensemble des chemins passant par cette transition. Certaines propriétés ne sont pas de nature booléenne, mais contiennent des valeurs textuelles (par exemple la valeur d’une prépo- sition), dans ce cas, le paramètre est remplacé dans la grammaire lexicalisée par la valeur de cette propriété. Il est également possible de nier un para- mètre : le paramètre @ !X@ signifie que le chemin identifié par ce paramètre sera conservé uniquement si la propriété d’intitulé X n’est pas acceptée par l’entrée considérée. Enfin, le paramètre spécial @%id@ sera remplacé au mo- ment de la lexicalisation par le numéro de ligne de l’entrée considérée. Ce paramètre est utile pour identifier de façon unique une entrée d’une table.
ANALYSE SYNTAXIQUE PROFONDE
Nous décrivons dans notre graphe les formes de base pour les verbes de cette table2. Les différents chemins de la grammaire sont identifiés par des paramètres qui réfèrent aux propriétés de la table leur correspondant. Par exemple, le paramètre @N0=Nhum@ réfère à la colonne dans la table indi- quant si le verbe admet un sujet humain, le paramètre @N0V@ réfère à la colonne qui indique si le verbe admet l’ellipse de son objet direct. De même, le paramètre @entry@ à valeur textuelle fait référence à la colonne dans la table où est donné le lemme de l’entrée. Le graphe de la figure 4.36 montre le résultat de la lexicalisation de la grammaire pour le verbe admettre.Contrairement à ce que laisse penser notre exemple, nous ne construisons pas, durant la lexicalisation de la meta-grammaire d’une table, un graphe lexicalisé différent pour chaque combinaison de graphe paramétré et d’entrée de la table. Dans la pratique, nous aplatissons au préalable chaque graphe paramétré principal décrivant un constituant syntaxique de la grammaire, de manière à ce qu’il soit décrit par un unique automate sans appel à des sous-graphes (cf. section 3.4). Puis, à partir de chacun de ces automates pa- ramétrés, nous construisons sa version lexicalisée constituée de l’union des descriptions de ce constituant syntaxique lexicalisées pour chacune des en- trées de la table. La grammaire générale est ensuite obtenue en construi- sant chaque constituant syntaxique par l’union des constituants lexicalisés de chaque table. Nous optimisons également notre grammaire.