Théorie des systèmes de dialogue

Facebook Tweet Pin Email

Dans cette section, nous proposons une définition des systèmes de dialogue (SD). Ces systèmes visent à reproduire des conversations d’humain à humain. Nous présentons les propriétés des conversations entre humains nécessaires à la compréhension des choix effectués dans la conception de SD (Jurafsky et Martin, 2014). Nous définissons les SD en général puis ceux appliqués aux échanges vocaux et textuels.

Dialogues humain-humain

Des éléments de conception des SD reposent sur des études philosophiques et sociologiques relatives aux interactions entre humains dans le cadre des conversations. Dans cette section nous définissons les concepts d’« actes de langage » et de « tours de parole » dans les conversations.

Acte de langage
L’acte de langage donne une interprétation de haut niveau d’un énoncé en langage naturel. Cette notion a été introduite en 1962 par le philosophe John L. Austin (1962): « Dire c’est faire » . Il propose d’associer l’énoncé d’un intervenant dans un dialogue à un acte pouvant avoir un effet dans une conversation, sur les autres interlocuteurs et sur l’environnement en général. Considéré comme un acte associé au langage, il est aussi composé d’un but, un prérequis, un corps et un effet. Il oppose d’abord, l’acte constatif à l’acte performatif. L’acte constatif a une fonction de description : on peut associer à ces énoncés une valeur de vérité. Alors que l’acte performatif décrit l’énoncé comme une action qui peut réussir ou échouer si elle est exécutée.

Par la suite, John L. Austin (1975) propose une classification approfondie décrivant un énoncé selon trois types d’actes : locutoires, illocutoires et perlocutoires. L’acte locutoire est le simple fait de dire quelque chose. L’acte illocutoire représente une intention (verdictive, promissive, exercitive, comportementative ou expositive) exprimée par le locuteur. L’acte est dit perlocutoire, si son énonciation par le locuteur a produit un effet sur son interlocuteur ou sur l’environnement , Finalement, un acte de langage donne une représentation de l’intention d’un locuteur dans une conversation indépendamment de son contenu sémantique. On décrit en général un acte de langage par sa fonction illocutoire.

John R. Searle (1969) reprend ces travaux et approfondit le concept illocutoire, en produisant une classification selon cinq types d’actes de langages : assertifs (expression de l’engagement du locuteur), directifs (expression de la volonté ou de désir que l’interlocuteur réalise quelque chose), promissifs (engagement dans une action), expressifs (expression d’un état psychologique) ou déclaratifs (affirmation d’une réalité sur le monde).

Tours et prise de parole dans une conversation
Un dialogue est par définition un ensemble d’échanges tenus entre des individus. La conversation est articulée selon des tours de parole entre les intervenants. Les études s’orientent selon deux axes : la détermination d’une structure générique de la conversation et la proposition de solution pour déterminer la fin d’un tour de parole. La discipline de l’Analyse Conversationnelle (AC), dont Harvey Sacks est le fondateur, vise à étudier les comportements des interactions dans une conversation. Contrairement aux idées présentées jusqu’alors, l’AC estime que ces tours de parole sont dirigés et ordonnés. Dans leurs travaux, Harvey Sacks, Emanuel A. Schegloff et Gail Jefferson, les trois pionniers du mouvement, décrivent un ensemble de règles génériques et systémiques régissant les conversations entre individus (Sacks et al., 1974). Les différentes règles et critères présentés permettent de décider qui doit ou peut parler par la suite. La détermination de la fin d’un tour de parole et du passage de la parole est étudiée selon les indices suivants :
• les silences : l’étude de la durée d’un silence à la suite d’un énoncé ;
• l’intonation de la voix : donne la parole à quelqu’un ;
• le langage corporel : désigner la personne à qui la parole est donnée.

Ces notions sont centrales dans la conception de SD. En particulier dans ceux utilisant la voix, où la détermination de la fin d’un tour de parole est une problématique étudiée dans les systèmes de reconnaissance vocale (Raux et Eskenazi, 2012).

Définition d’un système de dialogue

Un système de dialogue est un programme informatique capable de converser de manière naturelle, cohérente et structurée avec un humain (McTear, 2002). Il existe différents modes d’interaction : les interfaces graphiques, la voix, le texte, les expressions corporelles ou les expressions du visage. Ces modes peuvent aussi être combinés (systèmes multimodes). Dans le cas particulier des échanges textuels ou vocaux, la littérature utilise différents termes pour définir les systèmes : agents conversationnels (Jurafsky et Martin, 2014), interfaces conversationnelles (M. Smart, 2016) ou les systèmes de dialogue parlé (McTear, 2002) pour les échanges vocaux.

D’un point de vue théorique, l’ambition principale des SD est de reproduire des dialogues d’humain à humain pour permettre à un utilisateur de communiquer plus librement avec un système. Les interfaces graphiques actuelles imposent à l’utilisateur une interaction et des échanges déterminés qui impliquent l’appropriation par l’utilisateur des fonctions du système. Or, le langage naturel ne nécessite pas d’apprentissage au préalable et permet un échange plus souple (Lison et Meena, 2014).

Cependant dans l’application, permettre à un utilisateur de s’adresser librement et de se faire comprendre par un système relève de nombreuses problématiques concernant les tâches de : reconnaissance de l’entrée dépendante du mode considéré, compréhension du langage naturel, gestion de la conversation, génération d’une réponse et restitution à l’utilisateur dans le mode choisi.

Table des matières

INTRODUCTION
CHAPITRE 1 CADRE THÉORIQUE
1.1 Théorie des systèmes de dialogue
1.1.1 Dialogues humain-humain
1.1.1.1 Acte de langage
1.1.1.2 Tours et prise de parole dans une conversation
1.1.2 Définition d’un système de dialogue
1.1.3 Historique des applications des systèmes de dialogue
1.2 Développement des systèmes de dialogue
1.2.1 Les différents types de systèmes de dialogue
1.2.1.1 Par types de conversation d’humain à machine
1.2.1.2 Par degré d’initiative dans la conversation
1.2.2 Composants des systèmes de dialogue
1.2.2.1 Compréhension du langage naturel
1.2.2.2 Gestion de dialogue
1.2.2.3 Génération et restitution en langage naturel
1.2.3 Méthodes de contrôle du dialogue
1.2.3.1 Méthodes par modélisation manuelle
1.2.3.2 Méthodes statistiques
1.2.3.3 Avantages et Inconvénients
1.3 Système de dialogue et prise de rendez-vous
1.3.1 L’utilisation des SMS pour la prise de rendez-vous
1.3.2 La prise de rendez-vous par échanges en langage naturel
1.4 Conclusion
CHAPITRE 2 PHASE PRÉLIMINAIRE
2.1 Méthodologie et matériel
2.2 Récolte des messages
2.2.1 Application Web
2.2.2 Sélection des participants
2.2.3 Choix des moyens de communication
2.3 Analyse
2.3.1 Prétraitement des messages
2.3.2 Annotation d’entités
2.3.3 Annotation des expressions temporelles
2.3.3.1 Présentation de l’outil HeidelTime
2.3.3.2 Annotation des données récoltées
2.4 Résultats
2.4.1 Phase de récolte des messages
2.4.2 Catégorisation des messages
2.5 Conclusion
2.5.1 Retour sur les objectifs
2.5.2 Limites de la méthodologie
CHAPITRE 3 MACHINE À ÉTATS
3.1 Hypothèses et Définitions
3.1.1 Requête de l’utilisateur et rendez-vous
3.1.2 La conversation à modéliser
3.2 Méthodologie et matériel
3.2.1 Méthodologie
3.2.2 Choix technologiques
3.3 Modélisation
3.3.1 Modélisation de la machine à états
3.3.2 Modélisation des données
3.3.3 Décomposition en modules
3.4 Implémentation
3.4.1 Compréhension du langage naturel
3.4.1.1 Extraction des services
3.4.1.2 Extraction des expressions temporelles
3.4.2 Gestion du dialogue
3.4.2.1 Traitement d’un message
3.4.2.2 Développement de la machine à états
3.4.3 Génération de la réponse
3.4.4 Gestion de la prise de rendez-vous
3.5 Conclusion
3.5.1 Résultats
3.5.2 Avantages et limites de la méthode
3.5.2.1 La Gestion de la conversation
3.5.2.2 La compréhension de l’énoncé
3.5.3 Proposition
CHAPITRE 4 EXPLORATION D’UN OUTIL DE CONCEPTION D’INTERFACE
CONVERSATIONNELLE
4.1 Méthodologie et matériel
4.1.1 Méthodologie
4.1.2 Choix technologiques
4.2 Modélisation
4.2.1 Modélisation de la conversation
4.2.1.1 Définition des intentions
4.2.1.2 Définition des actions
4.2.1.3 Modélisation de la machine à états
4.2.2 Modélisation des données
4.2.3 Décomposition en modules
4.3 Implémentation
4.3.1 Compréhension du langage naturel
4.3.1.1 Création de l’ensemble d’entraînement
4.3.1.2 Reconnaissance d’intention dans les messages
4.3.2 Gestion de la conversation
4.4 Conclusion
4.4.1 Résultats
4.4.1.1 Exemples d’interactions
4.4.1.2 Stratégie d’entreprise
4.4.2 Apports et limites
CONCLUSION