Annoter manuellement avec Glozz
Notre schéma d’annotation a été conçu pour être utilisé avec la plateforme d’annotation manuelle Glozz (Widlöcher et Mathet, 2012). Il mobilise toutes les structures d’annotation prévues par le logiciel :– Les Unités. Grâce à elles, l’annotateur délimite au sein du texte des segments, allant du caractère au paragraphe, voire au-delà. Plusieurs types d’Unités ont été définis dans le schéma d’annotation afin de pouvoir repérer différents segments textuels liés à l’expression des émotions (segments exprimant une situation émotionnelle, une situation de cause d’émotion, etc.). À chaque type d’Unité sont associés des traits (features) afin de permettre à l’annotateur de renseigner des informations sur le segment annoté (ex. catégorie émotionnelle exprimée, etc.). Les Unités réalisent un premier niveau d’annotation qui consiste au repérage des marqueurs linguistiques des émotions.– Les Relations. Elles servent à relier deux Unités préalablement délimitées par l’annotateur et rendent ainsi explicite le lien qui unit les segments textuels captés par les deux Unités. De même que pour les Unités, plusieurs types de Relations ont été définis dans le schéma d’annotation et, pour chacun d’entre eux, d’éventuels traits permettent à l’annotateur de mieux caractériser la Relation annotée. Les Relations rendent compte d’un deuxième niveau d’annotation qui correspond à l’identification des relations entre les marqueurs linguistiques des émotions.– Les Schémas. Cette structure donne, théoriquement, la possibilité de relier plusieurs Unités, Relations et Schémas entre eux. Dans notre schéma d’annotation, un seul Schéma a été défini afin de lier entre elles toutes les Unités participant de l’expression d’un même passage émotionnel. Les Schémas représentent un troisième niveau d’annotation qui met en lumière la structure formée par les marqueurs linguistiques des émotions et les relations qu’ils entretiennent.
Pour que le corpus annoté manuellement avec Glozz soit ensuite exploitable (analyse manuelle qualitative ou quantitative, mobilisation du corpus dans des expériences de TAL, etc.), il est nécessaire de veiller à ce qu’il soit annoté de la manière la plus rigoureuse et la plus homogène possible. Puisque toutes les structures d’annotation (Unités, Relations et Schémas) sont Lors de l’annotation des émotions, l’annotateur est parfois amené à délimiter des Unités discontinues. Il doit alors utiliser la Relation Discontinue pour relier les différentes Unités qui constituent l’Unité discontinue. La Relation Discontinue est utilisée en post-traitement pour « recoller » les segments textuels captés par les différentes Unités discontinues. Considérons l’exemple (1). On souhaite ici annoter en situation émotionnelle tout le syntagme verbal, en excluant cependant l’adverbial temporel (les autres éléments de l’annotation de l’exemple (1) seront explicités plus loin). Pour cela, on est amené à délimiter deux Unités émotionnelles, une première sur le segment « ont bloqué » et une seconde sur le segment « le siège de la société Lactalis ». Ces deux Unités sont ensuite reliées par la Relation Discontinue afin de retrouver l’intégralité du segment « ont bloqué le siège de la société Lactalis » au post-traitement.
La Relation Discontinue est orientée. L’ordre dans lequel les Unités sont reliées est donc important : la Relation Discontinue doit obligatoirement partir de la première Unité délimitée (segment 1) pour aller vers la deuxième Unité (segment 2), selon l’ordre linaire du texte. Dans Glozz, toute Relation orientée apparaît sous la forme d’une flèche, ce qui permet aisément de vérifier que les Unités ont été reliées dans le bon ordre (la base de la flèche est sur le segment 1 et la pointe sur le segment 2). Toutes les informations d’annotation portant sur les Unités discontinues (type d’Unité, valeurs pour les différents traits associés à cette Unité) doivent impérativement être renseignées pour le segment 1. Toutes les autres Unités impliquées dans la relation Discontinue seront ensuite supprimées au post-traitement. Si une information d’annotation est associée uniquement à une autre Unité que la première, elle sera donc perdue au post-traitement. L’annotation des émotions telle qu’elle est envisagée dans notre schéma d’annotation repose tout d’abord sur le repérage de situations émotionnelles (Unités SitEmo) et des segments renvoyant aux individus affectés par ces émotions, les expérienceurs (Unités Experienceur). Ces deux types d’Unités sont reliés par la Relation Affecte. Le schéma prévoit également l’annotation des segments qui expriment les causes d’une situation émotionnelle (Unités SitCause) et de ceux qui en désignent les conséquences (Unités SitConsequence). Enfin notre schéma permet de rendre compte de l’organisation d’un passage émotionnel (Schéma PassageEmo) en mettant en relation toutes les Unités SitEmo participant de l’expression d’une même émotion, ainsi que les Unités SitCause et SitConsequence qui y sont sémantiquement liées.