Approches pour la recomposition de fragments sémantiques
A l’issue du décodage sémantique réalisé par les modèles DBN présentés au chapitre 8, le système de compréhension dispose de fragments structures composés de frames etde FE. Ces fragments sont des entités sémantiques composées qui représentent des sit- uations élémentaires incluses dans le message à interpréter. Les relations sémantiques liant ces situations élémentaires ne sont pas toujours décodées par les modèles DBN.En effet, ces relations sont souvent portées par des dépendances “longue-distance”, non modélisables par les DBN. La capture de ces relations nécessite donc l’examen global du message. Dans le con- texte de dialogue du corpus MEDIA, le message de l’utilisateur est borné par les in- terventions de l’opérateur simulant le serveur vocal. Les relations entre les fragments sémantiques produits par les DBN sont donc recherchées en considérant un tour de parole complet de l’utilisateur. Deux algorithmes de recomposition des arbres sémantiques dont les fragments (i.e. branches, ou sous-arbres) sont produits par les DBN ont été évalués. Ils sont détaillés dans la section 11.2. La première approche est déterministe, la seconde s’appuie sur les décisions de classifieurs SVM.
Les arbres étiquetés ont été définis en 10.2. Leur utilisation pour représenter les connaissances sémantiques et leur manipulation dans ce travail nécessitent la définition des opérations pouvant être réalisées sur ces arbres. Comme décrit en 8.5, l’apprentissage des paramètres des modèles DBN nécessite la projection de l’arbre de frames et FE associé à la phrase complète pour relier sous- branches sémantiques et concepts de base. Lors de cette projection, des opérations de deux types sont réalisées. Les opérations de séparation rompent des liens entre frames et FE selon les concepts qui leurs sont associés. Les opérations de duplication des ob- jets sémantiques (frames ou FE) sont nécessaires lorsque ces objets sont présents dans plusieurs sous-branches distinctes. L’algorithme de recomposition est développé pour rassembler les fragments séman- tiques produits par les DBN et rétablir l’arbre sémantique associé à la globalité du mes- sage. Il décide des opérations réciproques de celles effectuées lors de la projection, soit des opérations de liaison entre frames et FE et des opérations de regroupement entre frames ou FE.
Les liaisons potentielles inter-fragments s’appuient sur l’ontologie en frames et FE développée pour le domaine du corpus MEDIA : deux objets sémantiques ne peuvent être reliés que s’ils le sont dans l’ontologie. Ainsi, deux sous-branches sémantiques ne peuvent être connectées que si elles portent des nœuds dont les labels sont reliés dans l’ontologie. Les opérations de liaison consistent donc en l’ajout d’arêtes entre des Les identifications potentielles concernent les objets sémantiques semblables présents au sein de plusieurs fragments associés à un même message. L’algorithme de recom- position considère ces objets et décide de la pertinence de leur présences multiples. Les opérations de regroupement ont ainsi pour rôle de supprimer les objets sémantiques redondants produits par les DBN. Lorsque deux nœuds de sous-branches sont iden- tifiés, un seul est conservé dans l’arbre sémantique global et les nœuds fils du nœud supprimé sont reliés au nœud conservé. L’algorithme de recomposition doit être à même de recomposer l’arbre complet en disposant du message, des concepts associés et des branches générées par les DBN à partir de ces connaissances. Dans notre exemple, les deux frames LODGING doivent être regroupées. La liaison entre le FE reserve_theme et la frame LODGING résul- tante est naturellement réalisée dans ce cas. On remarquera que le message “réserver un séjour à Bourg-en-Bresse” aurait généré les branches RESERVE-reserve_theme et LODGING-lodging_location-LOCATION-location_town. L’algorithme de re- composition aurait eu dans ce cas à décider de la liaison entre le FE reserve_theme et la frame LODGING.