SÉMANTIQUE ET TEXTE L’ÉPREUVE DES CONTES
Les corpus ont révolutionné les pratiques d’analyse linguistique en donnant naissance à des Linguistiques de corpus, qui se définissent principalement par leur recours à des données attestées. Nous nous interrogeons dans ce volet sur la nature de l’éclairage que peut apporter une linguistique de corpus à la sémantique lexicale.
Nous nous intéresserons plus particulièrement aux points de rencontre entre la sémantique lexicale et la sémantique textuelle, entre Lexique et Discours. La question à laquelle nous tâcherons de répondre est la suivante : quels problèmes peut-on rencontrer lorsque l’on cherche à appliquer un modèle de sémantique lexicale aux textes ? Cette partie se focalisera sur les relations sémantiques entre Verbe et Nom dans un corpus de contes pour enfants.
Nous avons décrit chapitre 2 de nombreuses techniques de description lexicale en linguistique de corpus. Parmi celles-ci, l’analyse collocationnelle présente un intérêt particulier parce qu’elle fait émerger des associations significatives entre mots.
Nous proposons dans ce chapitre d’appliquer cette technique pour décrire les relations entre verbe et nom sur un corpus de contes (présenté en 3.1.2) dans l’objectif de caractériser les connaissances nécessaires à un système symbolique de détection des émotions (présenté en 3.1). Nous présenterons tout d’abord les difficultés auxquelles nous avons été confronté pour la construction d’un réseau de concepts (3.2),
en soulignant les intérêts et les limites de cette approche. Nous proposerons dans un second temps d’utiliser les relations syntaxiques pour compléter cette analyse (3.3) et nous évaluerons les résultats obtenus avec des ressources existantes pour le français. Ces travaux ont été réalisés dans le cadre du projet Emotirob décrit en première partie.
Contexte de recherche
Le Projet Emotirob
Le travail présenté dans cette partie a été établi en marge du projet EmotiRob14, collaboration inter-disciplinaire entre les laboratoires Valoria, LI et HCTI-Adicore. L’objectif du projet EmotiRob [Saint-Aime et al., 2007] était de concevoir un robot compagnon autonome susceptible d’apporter du réconfort à des enfants fragilisés (notamment en cas d’hospitalisation longue).
Le projet s’articulait en deux parties : la conception d’un module de détection des émotions des propos de l’enfant et celle d’un module d’interaction émotionnelle chargé de générer une réponse émotionnelle appropriée par des mouvements du corps, des traits du visage et des sons. Six émotions primaires devaient pouvoir être simulées :
joie, tristesse, dégoût, peur, surprise et colère. FIG 3.1 – Synoptique du projet EmotiRob Emologus [Le Tallec et al., 2010], le module de détection des émotions élaboré dans Emotirob, s’appuie sur une détection linguistique des émotions. L’émotion véhiculée dans un tour de parole est calculée à partir d’une représentation sémantique des mots reconnus de l’énoncé. Notre recherche s’est focalisée sur la description des connaissances nécessaires à cette phase de compréhension et à l’adaptation du système de compréhension Logus [Villaneau, 2003],
initialement conçu pour un tout autre domaine d’application. En d’autres termes, nous avons consacré nos recherches au vocabulaire susceptible d’être employé dans ces échanges et à son organisation sémantique. Logus constitue une mise en œuvre d’une approche logique dans un contexte de dialogue. Son architecture repose sur la définition d’une « connaissance sémantique » du domaine d’étude, qui comprend une ontologie ainsi que les liens sémantiques entre les concepts de cette ontologie.