Technologies internet

Tutoriel XML Schéma

Ce chapitre est une version raccourcie du tutoriel :

Introduction aux schémas W3C XML Schema
par Eric van der Vlist, Dyomedea (vdv@dyomedea.com), 18 décembre 2000
L'article a été publié sur XML.com sous le titre "Using W3C XML Schema".

Notre premier schéma

Considérons le document XML suivant :

<?xml version="1.0" encoding="utf-8"?>

<book isbn="0836217462">
  <title>
    Being a Dog Is a Full-Time Job
  </title>
  <author>Charles M. Schulz</author>
  <character>
    <name>Snoopy</name>
    <friend-of>Peppermint Patty</friend-of>
    <since>1950-10-04</since>
    <qualification>
      extroverted beagle
    </qualification>
  </character>
  <character>
    <name>Peppermint Patty</name>
    <since>1966-08-22</since>
    <qualification>bold, brash and tomboyish</qualification>
  </character>
</book>

La première approche, pour écrire un schéma, est de suivre sa structure et de définir chaque élément au moment où nous le rencontrons.

En rencontrant le prologue du document, nous ouvrons un élément "schema" :

<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
           elementFormDefault="qualified"
           attributeFormDefault="unqualified">

L'élément "schema" ouvre un schéma XML Schema. Il peut également contenir la définition de l'espace de nom cible et d'autres options.

Ensuite, nous définissons un élément nommé "book" correspondant à la balise "book". Cet élément ayant des attributs et des sous éléments, nous devrons le définir comme "complexType", l'autre type de données ( "simpleType" ) étant réservé aux éléments et attributs sans sous-éléments ou attributs et ne contenant donc que des valeurs.

La liste des sous éléments sera décrite à l'intérieur d'un élément "sequence" :

<xs:element name="book">
  <xs:complexType>
    <xs:sequence>

L'élément "sequence" définit une liste ordonnée de sous éléments. Nous verrons les deux autres possibilités ( "choice" et "all") plus loin.

Ensuite nous décrivons les éléments "title" et "author" comme des types simples puisqu'ils n'ont ni attributs ni sous-éléments. Le type que nous utilisons ("xs:string") est préfixé par l'espace de noms que nous avons choisi pour le schéma indiquant que nous utilisons un type prédéfini de XML Schema :

      <xs:element name="title" type="xs:string"/>
      <xs:element name="author" type="xs:string"/>

L'élément "character" doit être considéré comme un type complexe. Remarquez comment sa cardinalité est déclarée :

      <xs:element name="character"
          minOccurs="0" maxOccurs="unbounded">
        <xs:complexType>
          <xs:sequence>

XML Schema permet de définir la cardinalité des éléments (le nombre de leurs occurrences) avec beaucoup de précision et nous pouvons définir "minOccurs" (le nombre minimum d'occurrences) et "maxOccurs" (le nombre maximum d'occurrences). Ici, maxOccurs est déclaré "unbounded" c'est à dire que l'élément peut être répété autant de fois que l'auteur du document le souhaite. Ces deux attributs ont une valeur égale à 1 par défaut.

Nous spécifions ensuite la liste de ses éléments :

            <xs:element name="name" type="xs:string"/>
            <xs:element name="friend-of" type="xs:string"
                  minOccurs="0" maxOccurs="unbounded"/>
            <xs:element name="since" type="xs:date"/>
            <xs:element name="qualification" type="xs:string"/>

Nous terminons la description de l'élément "character" en fermant les éléments "complexType" et "element".

          </xs:sequence>
        </xs:complexType>
      </xs:element>

Nous terminons également la séquence des éléments pour l'élément "books" :

    </xs:sequence>

Et c'est le moment de définir les attributs de cet élément, les attributs devant toujours être déclarés après les éléments.

    <xs:attribute name="isbn" type="xs:string"/>

Notre schéma est terminé et nous pouvons refermer tous les éléments encore ouverts:

  </xs:complexType>
</xs:element>

</xs:schema>

Ce premier style de schémas, parfois appelé "poupées russes" est très proche de la structure d'un document significatif du vocabulaire, chaque élément ou attribut du document étant décrit quand on le rencontre.

Exemple complet:

<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
           elementFormDefault="qualified"
           attributeFormDefault="unqualified">

<xs:element name="book">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="title" type="xs:string"/>
      <xs:element name="author" type="xs:string"/>
      <xs:element name="character"
          minOccurs="0" maxOccurs="unbounded">
        <xs:complexType>
          <xs:sequence>
            <xs:element name="name" type="xs:string"/>
            <xs:element name="friend-of" type="xs:string"
                  minOccurs="0" maxOccurs="unbounded"/>
            <xs:element name="since" type="xs:date"/>
            <xs:element name="qualification" type="xs:string"/>
          </xs:sequence>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
    <xs:attribute name="isbn" type="xs:string"/>
  </xs:complexType>
</xs:element>

</xs:schema>

Découpons notre premier schéma

L'approche présentée plus haut, a deux inconvénients :

il peut devenir difficile à lire et à maintenir le style de schéma si la structure du document se complexifie
le style est très différent de la structure des DTDs, ce qui peut être gênant lors de la conversion manuelle ou automatique de DTDs en XML Schema

Le deuxième style de schéma construit, à la manière des DTDs, un simple catalogue d'éléments présents dans le document

en précisant, pour chacun, la liste de ses attributs et éléments
en utilisant des références à des éléments et attributs si c'est nécessaire

Nous obtenons une structure extrêmement plate:

<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
           elementFormDefault="qualified"
           attributeFormDefault="unqualified">

<!-- definition of simple type elements -->

<xs:element name="title" type="xs:string"/>
<xs:element name="author" type="xs:string"/>
<xs:element name="name" type="xs:string"/>
<xs:element name="friend-of" type="xs:string"/>
<xs:element name="since" type="xs:date"/>
<xs:element name="qualification" type="xs:string"/>

<!-- definition of attributes -->

<xs:attribute name="isbn" type="xs:string"/>

<!-- definition of complex type elements -->

<xs:element name="character">
  <xs:complexType>
    <xs:sequence>
      <!-- the simple type elements are referenced using
           the "ref" attribute                       -->
      <xs:element ref="name"/>
      <!-- the definition of the cardinality is done
           when the elements are referenced          -->
      <xs:element ref="friend-of" minOccurs="0" maxOccurs="unbounded"/>
      <xs:element ref="since"/>
      <xs:element ref="qualification"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

<xs:element name="book">
  <xs:complexType>
    <xs:sequence>
      <xs:element ref="title"/>
      <xs:element ref="author"/>
      <xs:element ref="character" minOccurs="0" maxOccurs="unbounded"/>
    </xs:sequence>
    <xs:attribute ref="isbn"/>
  </xs:complexType>
</xs:element>

</xs:schema>

L'utilisation d'une référence à un élément ou un attribut est comparable au clonage d'un objet : l'élément ou attribut est défini (tout comme l'objet serait créé) et dupliqué ailleurs dans le schéma par l'utilisation de l'attribut "ref" tout comme l'objet serait dupliqué par clonage. Les deux éléments ou attributs deviennent deux instances d'une même classe que nous avons créé implicitement et nous allons maintenant voir comment nous pouvons définir cette classe de manière explicite.

Définition de types nommés

XML Schema nous donne une troisième manière de procéder, en quelque sorte intermédiaire, qui consiste à définir des types de données pouvant être simples (et utilisables uniquement par des attributs ou des éléments au contenu simple (PCDATA)) ou complexes (utilisables uniquement pour définir des éléments) et utiliser ensuite ces types pour définir nos éléments et attributs.

Ceci est réalisé en donnant un nom aux éléments "simpleType" et "complexType" et en les définissant en dehors de toute définition d'élément ou d'attribut.

Nous allons également voir comment dériver un type à partir d'un autre type en donnant une restriction sur les valeurs acceptées par ce type de données.

Ainsi, pour définir un type de données que nous appellerons "nameType" et qui sera une chaîne de caractères acceptant un maximum de 32 caractères, nous écrirons:

<xs:simpleType name="nameType">
  <xs:restriction base="xs:string">
    <xs:maxLength value="32"/>
  </xs:restriction>
</xs:simpleType>

L'élément "simpleType" définit le nom du type de données. L'élément "restriction" et son attribut base indique que ce type de données est dérivé par restriction (en donnant une contrainte sur les données du type "string" appartenant à l'espace de noms XML Schema). L'élément "maxLength" est appelé une "facette" et définit cette restriction comme étant le fait que la taille maximale est de 32.

Une deuxième facette puissante est la facette "pattern" qui permet de donner une expression régulière qui devra être vérifiée pour que la valeur soit acceptée. Si nous écrivons un numéro ISBN sans signe "-", nous pouvons définir un type ISBN comme étant une chaîne de dix caractères numériques de la manière suivante :

<xs:simpleType name="isbnType">
  <xs:restriction base="xs:string">
    <xs:pattern value="[0-9]{10}"/>
  </xs:restriction>
</xs:simpleType>

D'autres facettes et les deux autres méthodes de dérivation ("list" et "union") seront vues plus loin.

Les types complexes sont également définis en donnant un nom à un "complexType".

Schéma complet :

<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
           elementFormDefault="qualified"
           attributeFormDefault="unqualified">

<!-- definition of simple types -->

<xs:simpleType name="nameType">
  <xs:restriction base="xs:string">
    <xs:maxLength value="32"/>
  </xs:restriction>
</xs:simpleType>

<xs:simpleType name="sinceType">
  <xs:restriction base="xs:date"/>
</xs:simpleType>

<xs:simpleType name="descType">
  <xs:restriction base="xs:string"/>
</xs:simpleType>

<xs:simpleType name="isbnType">
  <xs:restriction base="xs:string">
    <xs:pattern value="[0-9]{10}"/>
  </xs:restriction>
</xs:simpleType>

<!-- definition of complex types -->

<xs:complexType name="characterType">
  <xs:sequence>
    <xs:element name="name" type="nameType"/>
    <xs:element name="friend-of" type="nameType"
         minOccurs="0" maxOccurs="unbounded"/>
    <xs:element name="since" type="sinceType"/>
    <xs:element name="qualification" type="descType"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="bookType">
  <xs:sequence>
    <xs:element name="title" type="nameType"/>
    <xs:element name="author" type="nameType"/>
    <!-- the definition of the "character" element is
         using the "characterType" complex type    -->
    <xs:element name="character" type="characterType"
         minOccurs="0" maxOccurs="unbounded"/>
  </xs:sequence>
  <xs:attribute name="isbn" type="isbnType" use="required"/>
</xs:complexType>

<!-- Reference to "bookType" to define the
     "book" element -->
<xs:element name="book" type="bookType"/>

</xs:schema>

La définition et l'utilisation de types de données est comparable à la création d'une classe et à son utilisation pour créer un objet. Un type de données est une notion abstraite qui n'a pas d'instanciation et ne peut être utilisé que pour instancier un élément ou un attribut.

Autres exemples :

Groupes, compositeurs et dérivation.

Des groupes d'éléments et d'attributs peuvent être définis :

<!-- définition d'un groupe d'éléments -->

  <xs:group name="mainBookElements">
    <xs:sequence>
      <xs:element name="title" type="nameType"/>
      <xs:element name="author" type="nameType"/>
    </xs:sequence>
  </xs:group>

<!-- definition d'un groupe d'attributs -->

  <xs:attributeGroup name="bookAttributes">
    <xs:attribute name="isbn" type="isbnType" use="required"/>
    <xs:attribute name="available" type="xs:string"/>
  </xs:attributeGroup>

et utilisés pour définir des types complexes :

  <xs:complexType name="bookType">
    <xs:sequence>
       <xs:group ref="mainBookElements"/>
       <xs:element name="character" type="characterType"
            minOccurs="0" maxOccurs="unbounded"/>
    </xs:sequence>
    <xs:attributeGroup ref="bookAttributes"/>
  </xs:complexType>

Ces groupes ne sont pas des types de données à proprement parler, mais des conteneurs permettant de manipuler des ensembles d'éléments ou attributs de manière groupée pour la définition de types complexes.

XML Schema supporte trois types de compositeurs :

"sequence" - un groupe ordonné d'éléments (déjà vu)
"choice" - un groupe de particules dont une seule doit être présente
"all" - un ensemble non ordonné d'éléments

Les compositeurs eux-mêmes peuvent avoir des attributs minOccurs et maxOccurs pour définir leur cardinalité.

La construction suivante acceptera soit un élément "name" unique, soit un groupe de trois éléments (firstName, middleName et lastName) dont un (middleName) sera optionnel :

  <xs:group name="nameTypes">
    <xs:choice>
      <xs:element name="name" type="xs:string"/>
      <xs:sequence>
        <xs:element name="firstName" type="xs:string"/>
        <xs:element name="middleName" type="xs:string" minOccurs="0"/>
        <xs:element name="lastName" type="xs:string"/>
      </xs:sequence>
    </xs:choice>
  </xs:group>

La définition suivante décrit un type complexe dont les éléments peuvent apparaître dans un ordre quelconque :

  <xs:complexType name="bookType">
    <xs:all>
      <xs:element name="title" type="xs:string"/>
      <xs:element name="author" type="xs:string"/>
      <xs:element name="character" type="characterType"
          minOccurs="0" maxOccurs="unbounded"/>
    </xs:all>
    <xs:attribute name="isbn" type="isbnType" use="required"/>
  </xs:complexType>

Pour éviter des combinaisons pouvant devenir complexes et même ambiguës, XML Schema impose une série de restrictions sur l'utilisation des compositeurs "all" :

ils ne peuvent apparaître que comme élément unique tout en haut de la définition d'un modèle de contenu et les particules qui les composent ne peuvent être que des éléments et leur cardinalité ne peut être supérieure à un.

XML Schema fournit trois méthodes de dérivation pour la définition de types de données simples :

types dérivés par "restriction" - utilisation des facettes permettant de définir des contraintes sur les longueurs, le "pattern", les valeurs extrêmes, la précision et l'échelle, la période et la durée, la liste des valeurs possibles, ...
dérivation par "liste" - une liste séparée par des espaces de valeurs de type spécifié par l'attribut itemType
dérivation par "union"

La définition suivante utilise une dérivation par union afin de permettre au type de données ISBN d'accepter également les valeurs TDB et NA :

<xs:simpleType name="isbnType">
  <xs:union>
    <xs:simpleType>
      <xs:restriction base="xs:string">
        <xs:pattern value="[0-9]{10}"/>
      </xs:restriction>
    </xs:simpleType>
    <xs:simpleType>
      <xs:restriction base="xs:NMTOKEN">
        <xs:enumeration value="TBD"/>
        <xs:enumeration value="NA"/>
      </xs:restriction>
    </xs:simpleType>
  </xs:union>
</xs:simpleType>

L'élément "union" est ici appliquée aux deux types de données simples qui sont définis à l'intérieur permettant d'accepter les chaînes de 10 valeurs numériques (premier type) ainsi que les valeurs "TBD" et "NA" (deuxième type).

Ce type de données peut être à son tour utilisé pour constituer un nouveau type (isbnTypes) qui sera une liste séparée par des espaces de valeurs de type "isbnType" et une dérivation par restriction pourra ensuite être appliquée pour restreindre le nombre des valeurs dans la liste qui devra être compris entre 1 et 10 :

<xs:simpleType name="isbnTypes">
  <xs:list itemType="isbnType"/>
</xs:simpleType>

<xs:simpleType name="isbnTypes10">
  <xs:restriction base="isbnTypes">
    <xs:minLength value="1"/>
    <xs:maxLength value="10"/>
  </xs:restriction>
</xs:simpleType>

Autres exemples :

Types de contenus

Nous avons vu pour l'instant le type de contenu appliqué par défaut, permettant de définir des documents XML de type "données" dans lesquels les types complexes ont uniquement des noeuds attributs et éléments et les types simples des noeuds texte.

XML Schema supporte également la définition de

modèles de contenu vide
modèles de contenu simple avec attributs
modèles de contenu mixte.

Les éléments à contenu vide (c'est à dire ne pouvant contenir que des attributs) sont définis en omettant de définir des éléments dans un type complexe. La construction suivante définit un élément "book" à contenu vide acceptant un attribut "isbn" :

<xs:element name="book">
  <xs:complexType>
    <xs:attribute name="isbn" type="isbnType"/>
  </xs:complexType>
</xs:element>

Les éléments à contenu simple, c'est à dire des éléments ne contenant que du texte et des attributs, sont dérivés des types de données simples en utilisant l'élément "simpleContent". L'élément book pourrait donc être modifié de la manière suivante pour accepter également un contenu de type chaîne de caractères :

<xs:element name="book">
  <xs:complexType>
    <xs:simpleContent>
      <xs:extension base="xs:string">
        <xs:attribute name="isbn" type="isbnType"/>
      </xs:extension>
    </xs:simpleContent>
  </xs:complexType>
</xs:element>

Noter la position de la définition de l'attribut qui indique que l'extension est effectuée par l'ajout de l'attribut.

Cette définition acceptera, par exemple, l'élément XML suivant :

<book isbn="0836217462">
  Funny book by Charles M. Schulz.
  Its title (Being a Dog Is a Full-Time Job)
  says it all !
</book>

XML Schema supporte les modèles de contenu mixte au moyen de l'attribut "mixed" qui doit être placé dans l'élément "complexType".

La définition suivante :

<xs:element name="book">
  <xs:complexType mixed="true">
    <xs:all>
      <xs:element name="title" type="xs:string"/>
      <xs:element name="author" type="xs:string"/>
    </xs:all>
    <xs:attribute name="isbn" type="xs:string"/>
  </xs:complexType>
</xs:element>

décrira un élément XML de la forme :

<book isbn="0836217462">
  Funny book by <author>Charles M. Schulz</author>.
  Its title (<title>Being a Dog Is a Full-Time
  Job</title>) says it all !
</book>

On peut définir les mêmes restrictions, notamment de cardinalité, sur un élément de type mixte que sur un élément de type simple. Il n'est pas possible de définir la position relative des chaînes de caractères par rapports aux éléments.

Autres exemples :

Contraintes référentielles

XML Schema fournit des fonctionnalités permettant de décrire des contraintes d'unicité et des contrôles référentiels.

Dans la déclaration suivante, l'élément "unique" qui se trouve à l'intérieur de l'élément "book" indique que le nom d'un personnage doit être unique :

  <xs:unique name="charName">
    <xs:selector xpath="character"/>
    <xs:field xpath="name"/>
  </xs:unique>

La position de la déclaration de cette contrainte (à l'intérieur de la définition de l'élément "book") donne le contexte à partir duquel le contrôle sera effectué: l'élément "book". Le nom du personnage sera unique à l'intérieur d'un élément "book" mais pourra être répété dans un autre élément "book".

Le chemin XPath défini dans l'élément "selector" sélectionne l'élément qui doit être unique et doit donc pointer un noeud de type élément.

Le deuxième chemin XPath est évalué par rapport au noeud sélectionné et spécifie le noeud identifiant l'élément qui doit être unique. Il peut pointer un noeud de type élément ou attribut.

La seconde déclaration, "key" est similaire à "unique" et spécifie en outre que cette valeur unique pourra être utilisée comme une clé, ce qui lui donne deux contraintes supplémentaires : elle doit être non nulle et être référençable. Pour spécifier que le nom d'un personnage est une clé, il suffit de remplacer "unique" par "key" :

    <xs:key name="charName">
      <xs:selector xpath="character"/>
      <xs:field xpath="name"/>
    </xs:key>

La dernière déclaration, "keyref" définit une référence à une clé. Nous allons ainsi pouvoir tester que le nom inclus dans l'élément "friend-of" correspond à un personnage du même livre :

  <character>
    <name>Snoopy</name>
    <friend-of>Peppermint Patty</friend-of>
    <since>1950-10-04</since>
    <qualification>
      extroverted beagle
    </qualification>
  </character>

L'élément "keyref" est ajouté sous la définition de l'élément "book", au même niveau que l'élément "key" :

    <xs:keyref name="charNameRef" refer="charName">
      <xs:selector xpath="character"/>
      <xs:field xpath="friend-of"/>
    </xs:keyref>

Autres exemples :

Schémas réutilisables

Documentation de XML Schema

XML Schema a prévu une alternative aux commentaires et Processing Instructions XML qui devrait être plus facile à gérer pour les outils les supportant.

La documentation à l'intention des lecteurs humains peut être définie dans des éléments "documentation" tandis que les informations à l'intention de programmes doivent être incluses dans des éléments "appinfo". Ces deux éléments doivent être placés dans un élément "annotation". Ils acceptent des attributs optionnels "xml:lang" et "source" et tout modèle de contenu. L'attribut "source" est une référence à une URI qui peut être utilisée pour identifier l'objectif du commentaire ou de l'information.

Les éléments "annotation" peuvent être ajoutés "au début de la plupart des constructions" comme le montre cet exemple :

<xs:element name="book">
 <xs:annotation>
  <xs:documentation xml:lang="en">
    Top level element.
  </xs:documentation>
  <xs:documentation xml:lang="fr">
    Element racine.
  </xs:documentation>
  <xs:appInfo source="http://example.com/foo/">
    <bind xmlns="http://example.com/bar/">
      <class name="Book"/>
    </bind>
  </xs:appInfo>
 </xs:annotation>

Modularisation de XML Schema

XML Schema a prévu deux mécanismes d'inclusion.

Le premier, "include" , est similaire à un copié/collé des définitions contenues dans le schéma qui est inclus. Les définitions ne peuvent donc pas être redéfinies dans le schéma effectuant l'inclusion. Un exemple d'inclusion pourrait être:

<xs:include schemaLocation="character.xsd"/>

Le deuxième, "redefine", est semblable à "include", mais permet de redéfinir des déclarations effectuées dans le schéma inclus:

<xs:redefine schemaLocation="character12.xsd">
<xs:simpleType name="nameType">
 <xs:restriction base="xs:string">
  <xs:maxLength value="40"/>
 </xs:restriction>
</xs:simpleType>
</xs:redefine>

Noter que les déclarations qui sont redéfinies doivent l'être à l'intérieur de l'élément "redefine".

Groupes de substitutions

Contrairement à un type de données ou un groupe d'éléments, un groupe de substitutions ne se déclare pas en utilisant un élément spécifique, mais en référençant (au moyen de l'attribut "substitutionGroup") un élément choisi comme "tête" du groupe de substitution.

L'élément tête n'a d'autre particularité que de devoir être global et d'être suffisamment générique pour que les types des éléments du groupe de substitution puissent tous être dérivés de son type. Si nous déclarons:

<xs:element name="name" type="xs:string"/>
<xs:element name="surname" type="xs:string"
  substitutionGroup="name" />

nous formons un groupe de substitutions formé des éléments "surname" et "name" et ces éléments peuvent être utilisés indifféremment partout où "name" a été défini.

Éléments "abstraits"

Nous aurions également pu vouloir définir que la tête du groupe de substitutions soit un élément générique "name-elt" qui ne puisse pas être utilisé directement dans un document mais uniquement sous une de ses formes dérivées. Pour cela, XML Schema permet de déclarer des éléments abstraits, tout comme on peut déclarer une classe abstraite en programmation orientée objet. Ainsi par exemple:

<xs:element name="name-elt" type="xs:string" abstract="true"/>
<xs:element name="name" type="xs:string"
  substitutionGroup="name-elt" />
<xs:element name="surname" type="xs:string"
  substitutionGroup="name-elt" />

définit "name-elt" comme un élément abstrait qui doit être remplacé par "name" ou "surname" lorsqu'il est employé dans un document.

Éléments et types complexes "finaux"

Nous pourrions également souhaiter, au contraire, interdire ou contrôler les dérivations appliquées sur un type de données et XML Schema permet également de définir des éléments et des types complexes comme étant "finaux" en utilisant l'attribut "final". Cet attribut peut prendre les valeurs "restriction", "extension" ou "#all" et bloque respectivement les dérivations par restriction, extension ou toutes les dérivations. Le fragment suivant interdirait donc toute dérivation du type "characterType".

 <xs:complexType name="characterType" final="#all">

L'attribut "final" ne s'applique qu'aux éléments et aux types complexes et un mécanisme encore plus fin permet de controler la dérivation de types simples facette par facette. L'attribut correspondant ("fixed") s'applique aux différentes facettes et lorsque se valeur est "true", la facette ne peut plus être restreinte. L'exemple suivant montre comment on peut interdire toute restriction ultérieure sur la taille maximum du type "nameType" :

<xs:simpleType name="nameType">
 <xs:restriction base="xs:string">
  <xs:maxLength value="32" fixed="true"/>
 </xs:restriction>
</xs:simpleType>

Espaces de noms.

Le support des espaces de noms est une des principales motivations qui ont conduit au développement de XML Schema et ce support est particulièrement souple et simple. Il permet non seulement de gérer les espaces de noms en faisant abstraction des préfixes qui sont utilisées, mais également de définir des schémas ouverts qui acceptent l'ajout d'éléments et d'attributs provenant d'espaces de noms connus ou non.

Chaque schéma est lié à un espace de nom particulier (ou à l'absence d'espace de nom). Les éléments et attributs sans espace de noms peuvent eux être définis dans n'importe quel schéma.

La déclaration de l'espace de nom défini par un schéma est effectuée en utilisant l'attribut "targetNamespace" de l'élément "schema". Dans les exemples vus jusqu'à présent, cet attribut avait été omis, ce qui signifiait que nous travaillions sans espace de nom. Si nous modifions notre document "book" pour qu'il appartienne à un espace de noms :

<book isbn="0836217462" xmlns="http://example.org/ns/books/">

la manière la plus simple d'adapter notre schéma est de rajouter les attributs suivants à l'élément "schema" :

<xs:schema
   xmlns:xsd="http://www.w3.org/2000/10/XMLSchema"
   xmlns="http://example.org/ns/books/"
   targetNamespace="http://example.org/ns/books/"
   elementFormDefault="qualified"
   attributeFormDefault="unqualified" >

La déclaration xmlns:xsd="http://www.w3.org/2000/10/XMLSchema" est une déclaration classique conforme à la spécification des espaces de noms. XML Schema l'utilise également pour mémoriser que le préfixe "xsd" est attaché à l'espace de noms identifiant XML Schema et nous permettre de préfixer les types de données XML Schema par "xsd".

Ensuite, comme notre document utilise l'espace de nom "http://example.org/ns/books/", nous le définissons comme étant l'espace par défaut, ce qui nous évitera d'avoir à préfixer nos propres types de données, éléments et attributs dans ce schéma.

"targetNamespace" définit, indépendamment des déclarations de préfixes, l'espace de nom qui est décrit dans ce schéma. Si vous devez référencer des objets appartenant à cet espace de noms (ce qui est les cas sauf si vous utilisez une structure de type "poupée russe" pure, il faut également définir un préfixe pour cet espace de noms.

Les deux derniers attributs ("elementFormDefault" et "attributeFormDefault") sont liés à la possibilité offerte par XML Schema de définir dans un même schéma des attributs et éléments qualifiés (c'est à dire appartenant à un espace de noms) et non qualifiés (sans espace de noms).

La différentiation entre éléments et attributs qualifiés ou non qualifiés est faite objet par objet au moyen de l'attribut "form" pouvant prendre la valeur "qualified" ou "unqualified" et les attributs "elementFormDefault" et "attributeFormDefault" que nous voyons ici définissent la valeur par défaut, dans ce schéma, des attributs "form" pour les éléments et les attributs.

Une restriction importante: les éléments et attributs globaux (c'est à dire définis immédiatement sous l'élément "schema" ne peuvent pas être considérés comme étant non qualifiés.

Nous avons vu que XML Schema, à la manière de XSLT/XPATH, utilise les préfixes des espaces de noms dans la valeur des attributs "ref" ou "type" pour identifier l'espace de nom dans lequel l'objet à été défini.

Identification des objets appartenant à d'autres espaces de noms

Nous avons utilisé cette fonctionnalité tout au long de nos exemples pour identifier les types de données prédéfinis en les préfixant par xsd (préfixe que nous avons associé à "http://www.w3.org/2000/10/XMLSchema") et pour identifier nos propres objets sans les préfixer et nous allons maintenant voir comment nous pouvons le faire pour identifier des objets appartenant à d'autres espaces de noms.

Ceci est réalisé au moyen d'un processus en trois étapes qui est nécessaire y compris pour utiliser des attributs préfixés par "xml" et appartenant à l'espace de nom XML 1.0 et nous allons voir comment procéder en utilisant l'espace de noms XML 1.0. La première étape est de définir un préfixe pour cet espace de noms de manière standard, par exemple:

<xs:schema
     xmlns:xsd="http://www.w3.org/2000/10/XMLSchema"
   targetNamespace="http://example.org/ns/books/"
   xmlns:xml="http://www.w3.org/XML/1998/namespace"
   elementFormDefault="qualified" >

La deuxième étape consiste à indiquer à XML Schema où il pourra trouver le schéma correspondant à cet espace de nom en utilisant l'élément "import" :

<import namespace="http://www.w3.org/XML/1998/namespace"
  schemaLocation="myxml.xsd"/>

XML Schema sait maintenant où trouver le schéma correspondant à un objet préfixé par "xml" et nous pouvons donc utiliser ces objets:

   <xs:element name="title">
    <xs:complexType>
   <xs:simpleContent>
    <xs:extension base="xs:string">
        <xs:attribute ref="xml:lang"/>
    </xs:extension>
   </xs:simpleContent>
    </xs:complexType>
   </xs:element>

On peut se demander pourquoi avoir fait référence à l'élément "xml:lang" plutôt que d'avoir créé un élément ayant un type "xml:lang".

Nous l'avons fait en raison d'une différence importante entre utilisation de types et de références lorsque l'on travaille sur des espaces de noms différents:

Référencer un élément ou un attribut importe sa définition complète, y compris son nom complet avec son espace de noms.
Référencer un type de données importe sa définition mais vous laisse définir son nom qui ne peut qu'être non qualifié ou appartenir à l'espace de nom du schéma importateur.

Pour définir un attribut "xml:lang", nous n'avons donc pas le choix et devont le définir par référence.

Comment écrire des schémas ouverts et extensibles en autorisant des éléments appartenant à d'autres espaces de noms

Ceci est possible grâce à un jeu d'éléments "any" et "anyAttribute" permettant, respectivement, d'autoriser des éléments ou attributs.

Si nous voulions étendre la définition de notre type "descType" pour qu'il accepte n'importe quel élément XHTML, nous pourrions donc écrire:

 <xs:complexType name="descType" mixed="true">
  <xs:sequence>
   <xs:any namespace="http://www.w3.org/1999/xhtml"
    minOccurs="0" maxOccurs="unbounded"
    processContents="skip"/>
  </xs:sequence>
 </xs:complexType>

"descType" deviendrait ainsi un type à contenu mixte acceptant un nombre quelconque d'éléments de l'espace de noms "http://www.w3.org/1999/xhtml namespace". L'attribut "processContents" est positionné à "skip" pour indiquer à XML Schema que nous ne souhaitons pas valider ces éléments par rapport à un schéma pour XHTML. Les autres valeurs possibles sont "strict" imposant une validation et "lax" demandant de valider si le schéma correspondant est disponible. L'attribut "namespace" accepte une liste d'URIs séparées par des espaces et les valeurs spéciales "##any" (n'importe quel espace de noms), "##local" (éléments non qualifiés), "##targetNamespace" (l'espace de noms cible) et "##other" (tout espace de noms autre que la cible).

Il n'est pas possible de spécifier que l'espace de noms doit être autre que ceux contenus dans une liste.

"anyAttribute" permet la même fonctionalités que "any" mais est réservé aux attributs.

XML Schema dans les documents XML

Pour associer le document avec un schéma ne définissant pas d'espace de noms, on utilise l'attribut "noNamespaceSchemaLocation" :

<book isbn="0836217462"
  xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance"
  xsi:noNamespaceSchemaLocation="file:library.xsd">

alors que pour l'associer avec un schéma définissant un espace de nom on utilise "schemaLocation" (attention à la syntaxe associant une URI d'espace de nom et l'URI du schéma séparés par un espace dans un même attribut) :

<book isbn="0836217462" xmlns="http://example.org/ns/books/"
  xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance"
  xsi:schemaLocation="http://example.org/ns/books/ file:library.xsd">

Les deux autres attributs xsi sont "xsi:type" qui définit le type d'un élément et "xsi:null" qui indique que la valeur d'un élément est nulle (l'élément doit avoir été défini comme pouvant être nul au moyen de nullable="true" dans le schéma).

Ces deux attributs peuvent être utilisés dans les documents sans avoir été définis dans le schéma.