Cours modélisation et validation de documents XML, tutoriel & guide de travaux pratiques en pdf.
World Wide Web Consortium
• W3C – Fondé en 1994
• Consortium industriel international accueilli par différents sites
– MIT/LCS aux Etats-Unis
– INRIA en Europe
– Keio University au Japon
• 448 membres industriels en septembre 2000
• Accroitre le potentiel du WEB
– Standards et Normes
– Techniques, langages et architectures pour l’échange de documents sur le WEB
Langages de représentation de documents
• Par ordre chronologique:
– SGML (Norme ISO 8879 en 1986, révisée en 1988 et 1994)
• Méta-langage général
– HTML (Standard W3C depuis 1989)
• Structure générale figée
– XML (Standard W3C depuis 1998)
• Méta-langage simplifié compatible SGML
SGML: présentation
• Une norme internationale :
– Standard Generalized Markup Language
– ISO 8879 – 1989
• Un métalangage de balisage de documents
– lisible par l’être humain et traitable par une machine
– permet de définir des langages de balisage
• Les documents sont balisés conformément à la grammaire (la DTD)
– instances de DTD
– permet un balisage sémantique du fond.
• Implique la notion de validité d’un document
SGML : objectifs
• Séparation du fond et de la forme
– possibilité de multiples présentations
– un seul document en SGML
– plusieurs formats : Postcript, HTML, etc.
• Support de traitements sur le contenu des documents sans prise en compte de la forme
• Proposition d’un cadre défini pour l’expression des modèles documentaires (validité, contrôle)
• Format de stockage et d’échange normalisé
SGML : critiques
• Très lourd et complexe pour la mise en œuvre de documents respectant ce format
• Une grande rigueur est demandée à l’entrée des documents
• Standard complexe et complet pour le traitement des documents
• Liens hypertextes possibles mais complexes
HTML : présentation
• Proposé par le W3C comme format de documents sur le Web
• Langage simple avec des balises standardisées permettant la mise en forme d’un texte.
• Standard reconnu par tous les navigateurs.
• Langage très populaire sur le Web
<HTML>
<HEAD>
<TITLE> Exemple </TITLE>
</HEAD>
<BODY>
<H1>Contenu du document</H1>
<A HREF = « http://www.server.fr/Info /dir/test.html »> une référence externe</A>
</BODY>
</HTML>
HTML : inconvénients
• Normalisation des différentes balises difficile
– les constructeurs ont eu tendance à définir leurs propres balises pour répondre à leurs besoins (incompatibilité)
– HTML est dédié pour un seul type de terminaux
• Mises à jour difficiles
– restructuration ou remise en forme de l’ensemble des pages du site fastidieux
– Incapacité d’extension sans « plugins » coté client (formules mathématiques, modélisations de molécules, scènes 3D…)
• Mélange de structures logique et physique
– données utiles mélangée avec la mise en forme
– Difficultés à trouver l’information recherchée
SGML et HTML : Résumé
• SGML
– lange puissant pouvant décrire toute structure
– Documents difficile à définir
– Documents difficiles à utiliser
• HTML
– spécialisation de
SGML
– adapté à la présentation
– inadapté à l’échange
entre programmes
XML : Présentation
• XML= un nouveau langage d’échange basé sur le balisage
• XML= plus simple que SGML
• XML= plus ouvert que HTML
• XML = développé par XML Working Group dirigé par le W3C (depuis 1996)
• XML 1.0 = recommandation officielle du W3C depuis le 10 février 1998
XML: objectifs fixés par le W3C (1)
• XML doit pouvoir être utilisé sans difficulté sur Internet
• XML doit soutenir une grande variété d’applications
• XML doit être compatible avec SGML et HTML
• Il doit être facile d’écrire des programmes traitant les documents XML
• Le nombre d’options dans XML doit être réduit au minimum, idéalement à aucune
• Les documents XML doivent être lisibles par l’homme
• Les documents XML doivent être raisonnablement clairs
• La spécification de XML doit être disponible rapidement
• La conception de XML doit être formelle et concise
• Il doit être facile de créer des documents XML
• Fondements de la technologie XML
• Modélisation et validation de documents XML
• Présentation des documents XML
• Programmation en utilisant XML