IF dans les projets C-STAR et NESPOLE! (1996- ) (Interlingua spécialisé)
Historique du système
Le projet C-STAR (Consortium for Speech Translation Advanced Research) [C-STAR] [C-STAR II] est une coopération internationale. Le thème du projet est la traduction automatique de parole dans le domaine du tourisme (dialogue client-agent de voyage), en vidéoconférence. Lancé en 1989, C-STAR I traitait 3 langues (anglais, allemand et japonais) et a effectué les premières démonstrations transatlantiques trilingues en janvier 1993. C-STAR II a pris le relais, de 1993 à 1999, en s’étendant à 3 autres langues (coréen, italien, français).
C-STAR II a présenté des démonstrations bilingues, trilingues et quadrilingues en juillet et septembre 1999. En particulier, on a pu démontrer du français-coréen, grâce à la technique du « pivot IF », alors qu’aucune des 2 équipes ne connaissait la langue de l’autre. C-STAR III continue, avec les mêmes langues plus le chinois, et doit se terminer en 2005 ou 2006.
NESPOLE! (NEgotiating through SPOken Language in E-commerce) [NESPOLE!] est un projet d 30 mois qui a été financé par l’UE et la NSF (National Science Fondation) de 2000 à 2002; son but est d’explorer les futures applications de la traduction automatique de parole dans le domaine du e-commerce et du e-service. Le projet ne visait pas seulement une traduction orale viable mais aussi une investigation de la capacité de connecter deux humains ne parlant pas la même langue pour communiquer des idées, et résoudre des problèmes ensemble.Les participants de Nespole ! étaient trois laboratoires européens (CLIPS de l’UJF à Grenoble en France, ISL de l’université Karlsruhe en Allemagne, IRST de Trente en Italie), un laboratoire américain (ISL de CMU, Pittsburgh) et deux partenaires industriels (le bureau de tourisme de Trentino et Aethra, une compagnie italienne de télécommunications). Le système prototype construit dans ce projet avait pour but de fournir une communication efficace de parole entre toutes les paires de ces quatre langues : italien, anglais, français, et allemand. Les domaines traités ont été le tourisme, les renseignements de voyage, et (un peu) les consultations médicales. Le projet a commencé en janvier 2000 et s’est terminé en juin 2002.La structure de NESPOLE!, qu’on peut voir dans la figure ci-dessous, est basée sur l’intégration des modules que les partenaires ont développés dans C-STAR. Le médiateur (mediator) s’occupe de la communication audiovisuelle entre l’agent et le client. Le serveur HLT global (Human Language Technology) de Nespole! s’occupe de la traduction de parole capturée par le médiateur. Le serveur HLT global est constitué par les serveurs HLT spécifiques de chaque langue participante, et donc chaque HLT s’occupe de l’analyse et de la génération entre sa langue et l’IF. Il y a un « Communication Switch (CS) » qui s’occupe de la transmission de l’IF vers les serveurs HLT spécifiques.
Description du pivot
L’IF (Interchange Format) est le langage pivot utilisé dans les projets C-STAR et NESPOLE!, avec de petites modifications dans chaque projet. Proposé par Hans-Ulrich Block de Siemens, l’IF a été adopté par le projet C-STAR II en mai 1997, et développé pendant les deux années suivantes, pour la démonstration « princeps » internationale et quintilingue (anglais, allemand, coréen, français, et italien) du 22/07/1999. Il a ensuite été exploité et très souvent modifié par le projet NESPOLE!
Le domaine sémantique de cet IF est le voyage et le tourisme, y compris la réservation et le paiement pour les hôtels, les excursions et les transports. La différence entre les IF de C-STAR II et de NESPOLE! est que NESPOLE! n’inclut pas la réservation ni le paiement, mais comprend plus de détails pour les enquêtes des hôtels, des infrastructures pour les vacances d’été et de ski à Val di Fiemme en Italie.
Le principe de l’IF est toujours le même. L’IF est fondé sur des actes de dialogue (DA, Dialogue Act) auxquels sont adjoints des arguments. Un acte de dialogue est constitué d’un acte de parole (SA, Speech Act) complété par des concepts. Les actes de dialogue décrivent les intentions, les besoins de celui qui parle (give-information, introduce-self,…). Les concepts précisent à propos de quoi l’acte de dialogue est exprimé (price, room, activity, …). Les arguments permettent d’instancier les valeurs des variables du discours (room-spec, time, price, …).
Au moment de l’analyse, un tour de parole est d’abord découpé en « unités sémantiques de dialogue » (SDU, semantic dialogue unit). SDU est l’unité maximum du texte à analyser qui peut être représentée par un IF, et donc un énoncé d’un dialogue en langue naturelle peut correspondre à une ou plusieurs SDU.