Interactions complémentaires au résumé parlé

Interactions complémentaires au résumé parlé

Frise chronologique interactive

La plupart des échecs des systèmes de recherche d’information provient d’une mauvaise perception du besoin de l’utilisateur exprimé au travers d’une requête. Pour ou trepasser ce genre de situation, l’utilisateur n’a d’autre choix que de reformuler son besoin jusqu’à obtenir un succès. En général, il utilise deux types de sources d’information pour cette reformulation : sa connaissance générale du domaine et la structure de la base documentaire traitée. La section 2.1.5 présente quelques méthodes d’expansion de requête pour guider l’utilisateur dans l’expression de son besoin. Ces méthodes sont orientées par les cooccurrences des mots de la requête dans les documents considérés comme pertinents. Cette seule dimension ne permet pas de discriminer les mots proposés en fonction de la structure thématique de l’« espace informatif ». Chuang et Chien (2004) construisent par exemple une hiérarchie thématique à partir des résultats d’un moteur de recherche. La distribution temporelle de l’information est un autre axe fortement structurant dans le cas de nouvelles radio-diffusées.Nous proposons d’étudier cette distribution à travers une frise chronologique interactive. La figure 7.1 illustre son fonctionnement. L’information potentielle d’une tranche de temps est représentée comme la densité de résultats pertinents dans cette tranche. Au lieu d’avoir une résolution ajustable, les différentes granularités sont discrétisées sous la forme de plusieurs échelles temporelles synchronisées sur l’instant de lecture du flux audio. L’utilisateur peut explorer les différentes échelles en les faisant glisser vers le futur ou le passé de cet instant. L’idée derrière cette répartition en échelles est de créer une correspondance avec un système de quantification du temps naturel pour l’utilisateur : les années, les mois, les jours…. La frise chronologique est implémentée conjointement au résumé de parole dans le prototype présenté par la section suivante.

Description du prototype

L’ensemble des techniques présentées dans ces travaux est implémenté au sein d’un prototype dont l’objectif est de démontrer leur faisabilité technique et d’en effectuer une analyse globale. La mise en place du démonstrateur complet permet la validation des concepts proposés dans une approche impliquant directement l’utilisateur. La problématique principale étudiée dans ce document est provoquée par la quantité de données audio à écouter dans le cadre d’une recherche documentaire audio. Si le cas d’un moteur de recherche textuel est considéré, les documents retrouvés sont montrés à l’utilisateur sous forme d’une vue condensée incluant diverses informations jugées utiles pour déterminer rapidement la pertinence d’un document. Ces informations incluent souvent le titre, le thème, l’auteur, la source, ou la date de publication du document. Parfois, des extraits sont ajoutés pour contextualiser les résultats. Cette première représentation permet à l’utilisateur de décider s’il souhaite continuer l’exploration dans la direction d’un certain document. Le système lui délivre alors le document textuel que l’utilisateur commence par observer avant d’en lire une ou plusieurs parties. Très rapidement, en fonction de son expérience, l’utilisateur peut déterminer si un approfondissement s’avère nécessaire ou s’il lui faut passer au document suivant pour obtenir la réponse à son besoin en information. En général, la charte graphique, la structure thématique et une lecture rapide dirigent la décision précédente avec succès et rapidité. Dans le cas de l’audio, l’impossibilité d’avoir un aperçu global d’un document force l’utilisateur à passer beaucoup plus de temps à écouter le contenu. Cette perte de temps peut devenir fortement handicapante dans le cas de bases de données audio de grande taille. La solution de résumer les résultats du moteur de recherche trouve sa valeur réelle dans l’exploitation de données audio. Nous proposons donc de concevoir un démonstrateur incluant un moteur de recherche interrogeable de la même façon qu’un moteur de recherche textuel, mais dont les résultats sont résumés sous la forme d’extraits audio. Afin d’améliorer la perception de la structure des résultats par l’utilisateur, deux représentations supplémentaires lui sont proposées : des mots-clés évoquant le contenu et une frise chronologique interactive pour naviguer rapidement dans les résultats.

Interface utilisateur

La figure 7.2 montre un écran représentatif des éléments du démonstrateur. Tout d’abord, un champ de requête permet d’entrer une requête textuelle et de la soumettre au moteur de recherche. Les résultats retrouvés sont présentés sous trois formes complémentaires : une frise chronologique interactive, une série de mots-clés et une liste d’extraits sélectionnés pour le résumé. Les segments présentés dans la partie inférieure de la capture-écran ont été sélectionnés parmi les résultats du moteur de recherche en utilisant MMR-LSA1 , la méthode de résumé automatique présentée dans la section 5.3.1. Il est possible d’écouter les extraits, de voir leur transcription et d’explorer l’espace informatif qu’ils représentent en utilisant leur transcription comme requête. La transcription n’est pas montrée directement à l’utilisateur car il a tendance à trop lui faire confiance et à ne pas écouter l’audio Ce premier résumé des résultats est complété par une liste de mots-clés construite par la même méthode (MMR-LSA) mais dans l’espace de représentation des mots et non des phrases. Ces mots-clés sont généralement signifiants mais un filtrage sur les formes syntaxiques permettrait d’en améliorer l’utilité. L’utilisateur peut affiner sa requête en cliquant sur les mots-clés. Cette action les ajoute à la requête et met à jour les résultats. Une représentation temporelle des résultats et de leur résumé est conçue dans le but d’améliorer la capacité de l’utilisateur à localiser l’information dans le temps. Les résultats du moteur de recherche font appel à deux types de chronologie : la chronologie naturelle des événements (ce qui arrive) et la chronologie de leur apparition dans les thèmes du flux audio (quand on en parle). Afin de minimiser la confusion de l’utilisateur, seul le second type de chronologie est utilisé, mais il serait très intéressant 136 7.3. Enquête utilisateurs d’intégrer ces deux chronologies dans une même visualisation bénéfique à l’utilisateur. La frise chronologique du démonstrateur permet de naviguer dans l’ensemble de la base de données audio selon plusieurs échelles temporelles (année, mois, jour, heure, minute) sur lesquelles sont représentés la densité de résultats (dégradé vert), les données disponibles (rectangles rouges) et les extraits sélectionnés pour le résumé (chevrons bleus). Le curseur central représente la date courante de lecture du flux audio. L’utilisateur peut déplacer l’une des échelles afin d’observer l’évolution de la densité de résultats sur une autre échelle, ou de positionner le curseur à une date précise. La densité de résultats est calculée par rapport au score de chaque segment, quantifié sur une durée temporelle fixe (par exemple toutes les 5 minutes pour l’échelle des heures). Les intervalles sont normalisés sur la durée affichée (pour avoir un contraste relatif plus intuitif), et interpolés selon l’équation 7.1.