Analyse syntaxique profonde
Cette dernière partie présente quelques unes de nos expérimentations concer- nant l’analyse syntaxique profonde de textes en exploitant les propriétés syn- taxiques des éléments prédicatifs du français encodées dans les tables du lexique-grammaire. A cet effet, nous avons développé une grammaire lexi- calisé du français dans un formalisme à unification original (RTN décorés), qui est générée de manière semi-automatique à partir des tables du lexique- grammaire. Nous présentons, dans un premier temps, la méthodologie du lexique-gram- maire, en précisant en quoi les tables du lexique-grammaire sont une ressource précieuse pour le traitement automatique des langues. Nous présentons en- suite le formalisme grammatical des RTN décorés et nous le situons par rap- port à d’autres formalismes utilisés couramment pour l’analyse syntaxique. Puis, nous présentons notre grammaire du français dans son état actuel et nous terminons en donnant quelques résultats préliminaires des évaluations de sa couverture lexicale et syntaxique.Le lexique grammaire est une méthodologie pour l’étude empirique de la syntaxe des langues naturelles créée par Maurice Gross dont l’ouvrage fon- dateur est Méthode en syntaxe [Gross, 1975]. Cette méthodologie a pour cadre théorique la grammaire transformationnelle Harissienne [Harris, 1951, Harris, 1968] qui consiste en une approche mathématique de la linguistique, reposant sur des définitions rigoureuses et minimales. Dans ce cadre, le sujet d’étude est la phrase simple qui est considérée comme l’unité minimale de sens. Une phrase simple est composée d’un prédicat et de ses actants ou ar- guments, c’est-à-dire son sujet et ses compléments essentiels (par opposition aux compléments dits non-essentiels ou circonstanciels). Le prédicat est le noyau de la phrase, il s’agit le plus souvent d’un verbe plein. Ses arguments se distinguent par leur position dans la phrase (sujet, complément d’objet direct, complément prépositionnel, etc.) et par leur nature (groupe nominal humain, concret, phrase complétive, infinitive, etc.) :
Le prédicat d’une phrase élémentaire peut être également un nom, un adjectif ou un adverbe. Dans ce cas, la phrase contient également un verbe considéré comme sémantiquement vide et appelé verbe support dans ce contexte : Certaines expressions dites figées peuvent également jouer le rôle de prédi- cat d’une phrase. Elles ne présentent en surface pas de différences avec les constructions dites libres, mais certains de leurs éléments sont contraints et n’admettent pas ou peu de variations lexicales : Une phrase simple peut être sujette à une transformation (telle que la mise au passif, ou la pronominalisation, l’effacement ou le deplacement d’un argu- ment par exemple) produisant ainsi une nouvelle phrase considérée comme transformationnellement équivalente : Maurice Gross a mis en avant l’importance du lexique par rapport à lagrammaire. En effet, comme même Chomsky l’observait [Chomsky, 1965],les transformations syntaxiques, même les plus générales, sont sujettes à defortes contraintes au niveau lexical. Ainsi, une description complète de lasyntaxe d’une langue naturelle ne consiste pas en un ensemble de règles syn-taxiques générales mais nécessite également, et de manière aussi importante,une description détaillée pour chaque élément du lexique des formes et destransformations syntaxiques qu’il accepte ou n’accepte pas. Ainsi, MauriceGross a entrepris, avec son équipe au LADL, une description des proprié-tés syntaxiques des éléments prédicatifs du français : verbes, noms, adjectifs,adverbes et phrases figées. Pour chaque prédicat, ont été étudiées de ma-nière sytématique ses propriétés de sous-catégorisation (le nombre et la na-ture de ses arguments) ainsi que ses propriétés transformationnelles. Toutesces descriptions ont été encodées dans des dictionnaires syntaxiques sous laforme de tables, dites tables du lexique grammaire. Chaque table regroupeun ensemble de prédicats en fonction de propriétés définitionnelles, corres-pondant souvent à la structure de la phrase canonique. La figure 4.1, parexemple, contient un extrait de la table 9 qui regroupe l’ensemble des verbesqui rentrent dans la construction N0 V que P à N1 (= : Luc dit qu’il vabien à Lea). Chaque ligne de la table correspond à un prédicat ; chaque co-lonne correspond à une propriété. Une valeur booléenne (indiquée par un+ ou −) à chaque intersection d’une ligne et d’une colonne indique si telleentrée accepte ou non telle propriété. es chercheurs du lexique-grammaireont ainsi codé 12 000 emplois de verbes [Gross, 1975, Boons et al., 1976b,Boons et al., 1976a, Guillet et Leclère, 1992], 10 000 emplois de noms prédi-catifs [Giry-Schneider, 1978][Labelle, 1974][Meunier, 1981][Vivès, 1983] [de Negroni-Peyre, 1978] [Gross, 1989]. Les tables des adjectifs sont en cours de construction et il existeégalement des tables de phrases figées (M. Gross, 1984) comprenant une ving-taine de milliers d’entrées.