Cours traitement d’un document XML, tutoriel & guide de travaux pratiques en pdf.
Un document XML en quelques mots…
Un document XML est découpé en éléments structurés hiérarchiquement. Un document a un élément racine appelé élément du document. Un élément est composé : d’un nom ; d’attributs ; d’un contenu formé d’éléments ou de textes. Un texte est une chaîne de caractères. Un attribut a un nom et une valeur qui est une chaîne de caractères. Syntaxiquement, les éléments d’un document XML sont marqués dans le document lui-même par des paires de balises ouvrantes et fermantes.
Définition d’un type de document (DTD)
Les éléments qui décrivent un document peuvent être définis dans une DTD (Déclaration de Type de Document) ou bien dans un schéma écrit en XML Schema. Un document XML est dit bien formé si sa description est syntaxiquement correcte. Un document XML bien formé est dit valide si sa description est conforme à une DTD ou à un schéma.
Traitement d’un document XML
Un document XML est destiné à être traité par un processeur XML qui agit pour le compte d’une application Un processeur XML lit le document ; vérifie s’il est bien formé et s’il est valide (si sa DTD ou son schéma est fourni) ; le traduit sous une forme interne adaptée à son traitement par l’application.
Caractères
Le jeu de caractères utilisable pour décrire un document XML est celui d’Unicode ou de l’un de ses sous-ensembles. Un caractère de nom est soit une lettre, soit un chiffre, soit un point, soit un tiret, soit un espace souligné, soit un deux-points. Un caractère blanc est soit un espace, soit une tabulation, soit un retour chariot (CR), soit un saut de ligne (LF).
