Sérialisation de flux RDF
Dans cette section, nous présentons les principaux systèmes proposant une sérialisation adaptée aux flux RDF. RDSZ [18] (RDF Differential Stream compressor based on Zlib) est une méthode de compression RDF. L’encodeur différentiel utilisé par l’algorithme attribue un identifiant à chaque sujet et chaque objet des triplets RDF, et les enregistre dans une table de couples clefs-valeur.
On peut ainsi sérialiser les triplets RDF, en remplaçant les sujets et les objets par leurs identifiants, ou en les mettant à vide lorsque le sujet se répète sur plusieurs triplets. La figure 9 présente le résultat de l’encodage d’une mesure de capteur. Par la suite, RDSZ analyse quelle méthode de compression est la plus efficace entre l’application de l’algorithme Zlib [19] aux triplets de base, ou bien l’application de Zlib à la forme sérialisée.
Pour ce qui est de la décompression, la chaîne en entrée 36 Triplets RDF @prefix rdf: @prefix xsd: @prefix qudt: @prefix ssn: @prefix waves: waves:event_1j_sh ssn:hasValue waves.obs_1j_sh ; ssn:isProducedBy waves:Q_DT01 ; ssn:startTime « 2015-01-01T01:15:00″^^xsd:dateTime ; rdf:type ssn:SensorOutput . waves:obs_1j_sh qudt:numericValue 1.3E-1″^^xsd:double ; rdf:type ssn:ObservationValue . Résultat de l’encodage ?x0 ?x1 . ?x2 . ?x3 . ?x4 . ?x1 ?x5 . ?x6 . Couples clef-valeur ?x0 ?x1 ?x2 ?x3 « 2015-01-01T01:15:00″^^xsd:dateTime ?x4 ?x5 « 1.3E-1″^^xsd:double ?x6
Figure 9– L’encodage différentiel de RDSZ est d’abord passée au dé-compresseur Zlib, puis à un démultiplexeur qui décompose la chaîne de caractères sortie de la décompression en une liste d’objets RDF; il ne reste plus qu’à réutiliser l’encodeur différentiel pour remplacer les identifiants des triplets par les sujets et objets originels.
Si les gains de taille sont importants lors de l compression de graphes imposants, les avantages offerts par RDSZ sont moins avantageux pour des graphes plus petits, ou comportant peu d’URI. Par ailleurs, l’encodeur n’a pas été prévu pour les flux de données : les opération de compression et de décompression, dépendantes de la fréquence et de la tailles des éléments dans les flux, peuvent influencer grandement le temps de traitement.
Ztreamy [20] est une plate-forme middleware évolutive pour la distri 37 bution de flux de données sémantiques. Elle permet de publier des flux de données, afin que ces dernières soient consommées par d’autres applications; la plate-forme supporte des opérations telles que le mirroring (duplication de flux pour un traitement en parallèle),
la jointure, le partitionnement (sé paration d’éléments du flux pour un traitement spécifique) et le filtrage. L’approche évolutive et portable de ce projet le rend adaptable sur un large éventail de cas d’utilisation tels que, par exemple, la ville intelligente (smart cities) : gestion de mesures de capteurs physiques, réutilisation par des appli cations diverses, variété de formats…