Les sources d’information
Nous avons d´efendu au cours des chapitres pr´ec´edents la volont´e de rester le plus proche possible de la surface des ´enonc´es et en particulier d’´eviter au maximum de deviner les intentions des participants. Dans cette optique, nous allons nous focaliser sur les marqueurs linguistiques. Les marqueurs sont les signaux produits par le locuteur pour signaler les diff´erentes structures participant `a la coh´erence du discours [Roulet et al., 1985, Schiffrin, 1987]. Par exemple, Schiffrin indique que les marqueurs lexicaux sont des jalons signalant les sites d’´emergence de la structure discursive. Que ces marqueurs soient ou ne soient pas les “cr´eateurs” de la structure discursive, leur corr´elation avec cette derni`ere est exploitable pour l’analyse.
Les marqueurs permettent aux participants de d´esambigu¨ıser leurs ´enonc´es. Dans la conversation naturelle o`u les participants cherchent `a ˆetre le plus clair possible, ces marques sont tr`es p ´esentes.
Comme leur nom l’indique, elles sont explicites (intonatives, lexicales et syntaxiques) et fournissent directement des informations sur la structure. Elles foisonnent dans notre corpus de dialogues finali ´es o`u la r´ealisation de la tˆache prime sur le style de la conversation. En plus de l’analyse des marqueurs de surface directs, les structures syntaxiques, s´emantiques et pragmatiques nous permettent d’aller plus en profondeur dans l’analyse et de desambigu ´ ¨ıser les interpretations ´ quand l’examen des premiers indices de surface ne suffit pas.
La syntaxe des enonces
Notre travail se concentre sur l’articulation entre semantique ´ et pragmatique. Aussi notre analyse de la syntaxe des enonc ´ es´ de notre corpus ne sera pas approfondie. Il sera neanmoins ´ necessaire ´ d’inte´grer cet aspect et notamment d’articuler syntaxe et semantique ´ (mais aussi syntaxe et pragmatique) pour envisager l’analyse et la modelisation ´ complete ` des dialogues.
Un aspect essentiel de la syntaxe des enonc ´ es´ de notre corpus est leur nature orale et spontanee. ´ [Blanche-Benveniste, 1997] defend ´ la separation ´ entre les modes de production de la langue parlee´ (auxquels appartiennent des phenom ´ enes ` comme les bribes, les hesitations, ´ les amorces ou les auto-corrections1 ) de la syntaxe de la langue elle-meme. ˆ Ces phenom ´ enes ` difficiles sont apprehen- ´ des´ par les travaux en syntaxe robuste. Ces systemes ` sont bases´ sur des analyses par “petits bouts” [Abney, 1991] ou combinant differentes ´ methodes ´ comme propose´ dans le cadre du projet VERBMOBIL [Wahlster, 2001, Ruland et al., 1998]. Ces analyseurs ne visent plus a` reconnaˆıtre des phrases syntaxiques completes ` mais essayent de combiner les syntagmes identifies´ qui peuvent etre ˆ utilises´ pour l’interpretation ´ semantique. ´ Cette analyse permet d’obtenir des fragments apprehendables ´ par la semantique ´ [Denis, 2000, Ginzburg et al., 2001, Schlangen et Lascarides, 2003]. Malgre´ l’importance quantitative dans le corpus de ces fragments, l’unite´ qui nous concerne est la proposition. La phrase complete ` est souvent un segment complexe ou` se manifestent des relations rhetoriques ´ internes entre les propositions. Dans la determination ´ de la structure, le mode des enonc ´ es´ (et par consequent ´ le type des propositions) present ´ e´ dans le tableau 4.1 va jouer un role ˆ prepond ´ erant. ´ Les propositions qui nous interessent ´ particulierement ` sont ici les assertives (affirmatives et n ´gatives) et les interrogatives.
L’intonation
Nous pensons qu’une etude ´ intonative (et d’une maniere ` plus gen´ erale ´ prosodique) serait indispensable pour decrire ´ de maniere ` encore plus precise ´ les differents ´ phenom ´ enes ` du dialogue, mais l’etude ´ detaill ´ ee´ de l’intonation est particulierement ` delicate. ´ L’annotation systematique ´ de l’intonation est un long travailsupplementaire ´ que nous ne pouvions envisager dans le cadre de cette these. ` De plus, l’interpretation ´ de l’intonation doit souvent, elle aussi, etre ˆ envisagee´ en interface avec les autres composantes de la linguistique (syntaxe,semantique ´ mais aussi pragmatique) en vue de desambigu ´ ¨ıser certaines structures intonatives [Lambrecht, 1994, Steedman, 2000, Beyssade et al., 2003]. Nous travaillons cependant implicitement avec une certaine forme d’analyse prosodique puisque nous utilisonsle mode des enonc ´ es´ et que sa determination ´ est realis ´ ee´ par les annoteurs a` l’aide de la prosodie. Autrement dit, nous utilisons des ster´ eotypes ´ intonatifs qui distinguentseulement les propositions interrogatives des affirmatives et les accents les plus marques. ´ Rappelons enfin que comme le signale [Veronis, ´ 2000], les systemes ` automatiques de reconnaissance de la prosodie se limitent pour l’instant a` la reconnaissance de ces schemas ´ prosodiques stylises, ´ qui vont cependant plus loin que notre analyse minimale.
Nous verrons enfin que certaines accentuations sur un mot ou un groupe de mots indiquent d’autres relations de dialogues comme la correction (voir exemple 4.1). Cependant ces “incursions” dans le domaine prosodique ne sont pas a` comparer avec les travaux specifiques ´ sur ce sujet qui decortiquent ´ la melodie ´ des phrases [Morel et Danon-Boileau, 1998].
Les aspects lies´ a` l’explication d’itineraire
Les aspects globaux relatifs a` la structure de l’itinerair e
Nous avons vu au chapitre 2 que l’explication d’itineraire ´ etait ´ une tache ˆ cognitive complexe dans laquelle residaient ´ plusieurs sous-taches. ˆ Expliquer un itineraire ´ necessite ´ d’expliquer comment le suivre mais aussi de decrire ´ les reperes ` qui lui sont associes. ´ Ces taches ˆ de prescription et de description co-existent tout au long du dialogue.
La structure globale du dialogue n’est donc pas aussi simple que nous l’avions envisage´ de prime abord dans [Pre´vot, 2000]. Nous avions alors consider´ e´ ces dialogues sur deux dimensions, celle de l’itineraire ´ fondee´ sur sa structure sequentielle ´ et celle de l’interaction sur laquelle se d ´veloppaient les sous-dialogues etablissant ´ les etapes ´ (clarification, confirmation. . .). La description des reperes ` etait ´ consider´ ee´ comme un moyen d’etablir ´ la prescription courante et placee´ sur l’axe de l’interaction.
Certains dialogues cependant se concentrent sur l’ancrage des reperes ` et ne´gligent completement ` la prescription des actions a` suivre. Dans ce cas, le receveur ancre les reperes ` principaux et n’a pas besoin de prescrire ni de decrire ´ les segments d’itineraires ´ a` suivre. Avec l’objectif de preciser ´ cette structure nous allons mettre en correspondance plusieurs propositionssur le sujet.
Denis et Briffault [Denis, 1997, Denis et Briffault, 1997], dans le cadre d’une explication totalement linguistique dans le meme ˆ contexte que celui de nos dialogues (c’est-a-dire ` sans aide graphique et produite hors du site du suivi du parcours), proposent une structure pour les explications d’itine-´ raires :
Les prescriptions sans referenceaux reperes
Les prescriptionssont les actions a` effectuer pour suivre l’itineraire ´ explique.´ Denis [Denis, 1997] recense dans son corpus 16.9% d’enonc ´ es´ de cette cate´gorie alors que nous n’en avons que 5% dans le notre. ˆ L’experience ´ de Denis sous-jacente a` ces statistiques etait ´ un peu differente ´ de la notre ˆ puisqu’elle ne visait pas a` recueillir des dialogues mais des monologues descriptifs. Le corpus etait ´ constitue´ de 40 descriptions pour 609 enonc ´ es´ au total. Les chiffres rappeles´ ici sont le resultat ´ de la moyenne entre deux itineraires ´ differents, ´ mais les resultats ´ pour chacun des itineraires ´ etaient ´ tres` proches de cette moyenne.
Au sujet des chiffres de notre corpus (1235 segments pour 747 tours de paroles et 21 dialogues), les pourcentages ne sont pas calcules´ sur la base de tous les enonc ´ es. ´ Environ la moitie´ des enonc ´ es´ possedent ` une fonction essentiellement interactive. Par consequent ´ les pourcentages fournis sont calcules´ sur la base des enonc ´ es´ contenant des informations liees ´ aux itineraires. ´ Nous reviendrons cependant sur les differences ´ de repartition ´ apres` avoir examine´ les autres cate´gories.
Les prescriptions avec ref´ er´ ence aux reper` es
Les prescriptionssont la plupart du temps produites en faisant ref´ erence ´ a` des reperes. ` Ces derniers peuvent avoir et´ e´ prealablement ´ introduits ou l’etre ˆ par la prescription elle-meme. ˆ Denis annonce que 33.5% des enonc ´ es´ de son corpus appartiennent a` cette cate´gorie alors que nous n’en trouvons que 16% dans le notre. ˆ La tradition ref´ erentielle ´ de la linguistique a montre´ que les ref´ erences ´ a` des reperes ` dej´ a` introduits etaient ´ realis ´ ees ´ par des SN (Syntagmes Nominaux) definis ´ et les autres par des SN indefinis. ´ En pratique, “nos” participants presupposent ´ la plupart du temps que les reperes ` qu’ils utilisent sont connus de leur interlocuteur. Par consequent, ´ une ecrasante ´ majorite´ de ces ref´ erences ´ se fait par l’interme-´ diaire d’expressions contenant des noms propres comme dans l’exemple 4.4 et sont des expressions definies ´ . Cette pratique s’explique par le sentiment pour la plupart des fournisseurs d’appartenir a` une meme ˆ communaute´ epist ´ emique ´ [Beyssade, 1998] : la population toulousain