Modélisation des documents multimédias
Introduction Le modèle d’un document repose sur une représentation abstraite qui reflète sa structuration et sa sémantique, ainsi la modélisation est destinée à décrire des architectures permettant d’intégrer les structures et les données de description et aussi toutes les relations qui peuvent exister entre leurs éléments au sein d’un même modèle. Un tel modèle permettra la manipulation et la gestion d’ensembles de documents qui peuvent être très hétérogènes selon plusieurs points de vue (sur le fond, et sur la forme). Les modèles de représentation des documents multimédias peuvent être classés selon deux types : (1) modélisation séparée des medias qui consiste à décomposer chaque document en plusieurs parties monomédia (texte, audio, image et vidéo), (2) modélisation globale des médias qui est capable de décrire simultanément différents types de média (un type de document peut être composé d’autres types de documents). Malgré les grands avantages offerts par ces modèles, la majorité d’entre eux n’offre pas une séparation claire des informations relatives au contenu de celles relatives à la structure (descriptions structurelles et métadonnées), aussi avec ces approches nous ne pouvons pas exploiter les informations qui ne sont pas identifiées dans la structure de base. L’utilisation des modèles de représentation des documents évoque le problème de l’interopérabilité et donc de classification des différents documents hétérogènes. Ce qui concerne la classification des documents multimédias, elle consiste à regrouper les documents similaires au sens structurel, la classification demeure encore aujourd’hui une des difficultés majeures, car beaucoup de travaux dans ce domaine ne garantit pas des résultats optimums. C’est dans l’amélioration de ces point faible où résident le travail de l’auteur dans [1], son approche vise à gérer des grandes masses de documents multimédia hétérogènes d’une manière optimale, elle se base sur trois axes : la représentation (modélisation), la classification et l’exploitation des documents hétérogènes. Dans ce chapitre nous présentons les deux premiers axes qui sont la modélisation et la classification des documents multimédia hétérogènes, on va voir aussi des exemples d’instanciation pour enlever tout type d’ambiguïté.
Modélisation des documents multimédia
La modélisation des documents multimédia dans [1] est considéré comme une modélisation globale des médias, elle permet d’intégrer plusieurs niveaux de description imbriqués et complémentaires (une couche générique et une couche spécifique, une description logique et une description sémantique). Nous allons expliquer chacun de ces structures et de ces modèles d’une façon séparé, puis on va voir le modèle globale de représentions de documents multimédia présenté dans . Pour instancier ces différents modèles nous utiliserons les documents de base : « Présentation_Pyramides » et « Présentation_Colisée ».
Modélisation de la structure logique
La structure logique d’un document est représentée dans [1] sous forme d’un ensemble imbriqué et ordonné d’éléments logiques spécifiques (« EltSpe »), chaque élément spécifique peut être compose d’autre éléments spécifiques. Les attributs spécifiques (« AttSpe ») permettent de décrire les éléments spécifiques.
Description sémantique
Dans l’union entre la structure logique et une ou plusieurs structures des métadonnées (les structures des métadonnées représentent le contenu des documents) forme la description sémantique du document, cette description est représentée dans la figure suivante :