XML Schema 复杂元素类型详解:定义及示例解析

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
应用实时监控服务-应用监控,每月50GB免费额度
应用实时监控服务-用户体验监控,每月100OCU免费额度
简介: 在XML Schema(XSD)中,复杂元素包含其他元素和/或属性,分为4类:空元素、仅含元素、仅含文本和既含元素也含文本。定义复杂元素可通过直接声明或引用预定义的复杂类型。复杂空元素仅含属性,而仅含元素的类型则只包含其他子元素。XSD提供了`<xs:sequence>`、`<xs:all>`、`<xs:choice>`等指示器来规定元素顺序和出现次数,以及`<xs:attributeGroup>`和`<xs:group>`来组织元素和属性。

在XML Schema(XSD)中,复杂元素是指包含其他元素和/或属性的XML元素。复杂元素可以分为四种类型:

  1. 空元素: 仅包含其他元素和/或属性的元素。
  2. 仅包含其他元素的元素: 不包含文本内容,只包含其他子元素的元素。
  3. 仅包含文本的元素: 不包含其他子元素,只包含文本内容的元素。
  4. 既包含其他元素又包含文本的元素: 同时包含其他子元素和文本内容的元素。

以下是复杂元素的一些示例:

  • 空元素:
<product pid="1345"/>
  • 仅包含其他元素的元素:
<employee>
  <firstname>John</firstname>
  <lastname>Smith</lastname>
</employee>
  • 仅包含文本的元素:
<food type="dessert">Ice cream</food>
  • 既包含其他元素又包含文本的元素:
<description>
It happened on <date lang="norwegian">03.03.99</date> ....
</description>

在XML Schema中,可以通过以下两种方式定义复杂元素:

  1. 使用<xs:element>元素直接声明元素,并在其中定义复杂类型。例如:
<xs:element name="employee">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>
  1. 使用<xs:complexType>元素定义复杂类型,然后在需要的地方引用该类型。例如:
<xs:element name="employee" type="personinfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

您还可以基于现有的复杂类型创建新的复杂类型,并在其中添加额外的元素,如上面的第二个示例所示。

<xs:element name="employee" type="fullpersoninfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="fullpersoninfo">
  <xs:complexContent>
    <xs:extension base="personinfo">
      <xs:sequence>
        <xs:element name="address" type="xs:string"/>
        <xs:element name="city" type="xs:string"/>
        <xs:element name="country" type="xs:string"/>
      </xs:sequence>
    </xs:extension>
  </xs:complexContent>
</xs:complexType>

一个空的复杂元素在XML中不包含内容,只能包含属性。以下是关于XSD中空元素的一些说明和示例:

复杂空元素

一个空的XML元素示例:

<product prodid="1345" />

在上面的示例中,"product"元素没有任何内容,只有一个名为"prodid"的属性。

在XSD中定义一个空元素需要遵循以下步骤:

  1. 使用<xs:element>元素定义元素。
  2. 使用<xs:complexType>元素定义复杂类型。
  3. 使用<xs:complexContent>元素指定内容模型。
  4. 使用<xs:restriction>元素基于基本类型(如整数)定义限制。
  5. 使用<xs:attribute>元素定义属性。

以下是一个定义空元素的XSD示例:

<xs:element name="product">
  <xs:complexType>
    <xs:complexContent>
      <xs:restriction base="xs:integer">
        <xs:attribute name="prodid" type="xs:positiveInteger"/>
      </xs:restriction>
    </xs:complexContent>
  </xs:complexType>
</xs:element>

但是,您也可以更简洁地定义空元素,如下所示:

<xs:element name="product">
  <xs:complexType>
    <xs:attribute name="prodid" type="xs:positiveInteger"/>
  </xs:complexType>
</xs:element>

或者,您可以给复杂类型指定一个名称,并将"type"属性设置为该名称,如下所示:

<xs:element name="product" type="prodtype"/>

<xs:complexType name="prodtype">
  <xs:attribute name="prodid" type="xs:positiveInteger"/>
</xs:complexType>

仅包含元素的复杂类型

一个"仅包含元素"的复杂类型包含一个只包含其他元素的元素。

例如,以下是一个包含仅包含其他元素的XML元素 "person" 的示例:

<person>
  <firstname>John</firstname>
  <lastname>Smith</lastname>
</person>

您可以使用<xs:sequence>元素在模式中定义 "person" 元素,如下所示:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

在上述示例中,<xs:sequence>元素表示在 "person" 元素内部定义的元素("firstname" 和 "lastname")必须按照该顺序出现。

或者,您也可以给复杂类型指定一个名称,并将"type"属性设置为该名称,如下所示:

<xs:element name="person" type="persontype"/>

<xs:complexType name="persontype">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

在上述示例中,我们将复杂类型的名称设置为"persontype",然后将"type"属性设置为该名称,以便多个元素可以引用相同的复杂类型。

注意:为了允许字符数据出现在 "letter" 的子元素之间,必须将 mixed 属性设置为 "true"。<xs:sequence> 标签表示定义的元素(name、orderid 和 shipdate)必须以该顺序出现在 "letter" 元素内

我们还可以给 complexType 元素一个名称,并让 "letter" 元素具有指向 complexType 名称的 type 属性(如果使用此方法,多个元素可以引用相同的复杂类型):

<xs:element name="letter" type="lettertype"/>

<xs:complexType name="lettertype" mixed="true">
  <xs:sequence>
    <xs:element name="name" type="xs:string"/>
    <xs:element name="orderid" type="xs:positiveInteger"/>
    <xs:element name="shipdate" type="xs:date"/>
  </xs:sequence>
</xs:complexType>

XSD 指示器
我们可以使用指示器来控制文档中元素的使用方式。

指示器
有七个指示器:

顺序指示器:

  • All
  • Choice
  • Sequence

出现指示器:

  • maxOccurs
  • minOccurs

组指示器:

  • 组名称
  • 属性组名称

顺序指示器
顺序指示器用于定义元素的顺序。

All 指示器
<all> 指示器指定子元素可以以任何顺序出现,并且每个子元素只能出现一次:

<xs:element name="person">
  <xs:complexType>
    <xs:all>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:all>
  </xs:complexType>
</xs:element>

注意:在使用 <all> 指示器时,您可以将 <minOccurs> 指示器设置为 0 或 1,并且 <maxOccurs> 指示器只能设置为 1(有关 <minOccurs><maxOccurs> 的说明稍后描述)。

Choice 指示器
<choice> 指示器指定可以出现一个子元素或另一个子元素:

<xs:element name="person">
  <xs:complexType>
    <xs:choice>
      <xs:element name="employee" type="employee"/>
      <xs:element name="member" type="member"/>
    </xs:choice>
  </xs:complexType>
</xs:element>

Sequence 指示器
<sequence> 指示器指定子元素必须以特定顺序出现:

<xs:element name="person">
   <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

出现指示器
出现指示器用于定义元素可以出现的次数。

注意:对于所有的 "顺序" 和 "组" 指示器(all、choice、sequence、组名称和组引用),maxOccurs 和 minOccurs 的默认值为 1。

maxOccurs 指示器
<maxOccurs> 指示器指定元素可以出现的最大次数:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="full_name" type="xs:string"/>
      <xs:element name="child_name" type="xs:string" maxOccurs="10"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

上面的示例指示了在 "person" 元素中,"child_name" 元素可以出现最少一次(minOccurs 的默认值为 1),最多出现十次。

minOccurs 指示器
<minOccurs> 指示器指定元素可以出现的最小次数:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="full_name" type="xs:string"/>
      <xs:element name="child_name" type="xs:string"
      maxOccurs="10" minOccurs="0"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

上面的示例指示了在 "person" 元素中,"child_name" 元素可以出现最少零次,最多出现十次。

提示:要允许元素出现无限次数,使用 maxOccurs="unbounded" 语句:

<xs:element name="child_name" type="xs:string" maxOccurs="unbounded"/>

一个工作示例:

名为 Myfamily.xml 的 XML 文件:

<?xml version="1.0" encoding="UTF-8"?>

<persons xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="family.xsd">

<person>
  <full_name>Hege Refsnes</full_name>
  <child_name>Cecilie</child_name>
</person>

<person>
  <full_name>Tove Refsnes</full_name>
  <child_name>Hege</child_name>
  <child_name>Stale</child_name>
  <child_name>Jim</child_name>
  <child_name>Borge</child_name>
</person>

<person>
  <full_name>Stale Refsnes</full_name>
</person>

</persons>

上面的 XML 文件包含一个名为 "persons" 的根元素。在这个根元素内,我们定义了三个 "person" 元素。每个 "person" 元素必须包含一个 "full_name" 元素,最多可以包含五个 "child_name" 元素。

以下是模式文件 family.xsd

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified">

<xs:element name="persons">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="person" maxOccurs="unbounded">
        <xs:complexType>
          <xs:sequence>
            <xs:element name="full_name" type="xs:string"/>
            <xs:element name="child_name" type="xs:string"
            minOccurs="0" maxOccurs="5"/>
          </xs:sequence>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
  </xs:complexType>
</xs:element>

</xs:schema>

组指示器
组指示器用于定义相关的元素集合。

元素组
元素组使用 group 声明来定义,如下所示:

<xs:group name="groupname">
...
</xs:group>

您必须在组声明中定义 all、choice 或 sequence 元素。以下示例定义了一个名为 "persongroup" 的组,该组定义了必须以精确顺序出现的一组元素:

<xs:group name="persongroup">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
    <xs:element name="birthday" type="xs:date"/>
  </xs:sequence>
</xs:group>

在定义了组之后,您可以在另一个定义中引用它,如下所示:

<xs:group name="persongroup">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
    <xs:element name="birthday" type="xs:date"/>
  </xs:sequence>
</xs:group>

<xs:element name="person" type="personinfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:group ref="persongroup"/>
    <xs:element name="country" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

属性组

属性组使用 attributeGroup 声明来定义,如下所示:

<xs:attributeGroup name="groupname">
...
</xs:attributeGroup>

以下示例定义了一个名为 "personattrgroup" 的属性组:

<xs:attributeGroup name="personattrgroup">
  <xs:attribute name="firstname" type="xs:string"/>
  <xs:attribute name="lastname" type="xs:string"/>
  <xs:attribute name="birthday" type="xs:date"/>
</xs:attributeGroup>

在定义了属性组之后,您可以在另一个定义中引用它,如下所示:

<xs:attributeGroup name="personattrgroup">
  <xs:attribute name="firstname" type="xs:string"/>
  <xs:attribute name="lastname" type="xs:string"/>
  <xs:attribute name="birthday" type="xs:date"/>
</xs:attributeGroup>

<xs:element name="person">
  <xs:complexType>
    <xs:attributeGroup ref="personattrgroup"/>
  </xs:complexType>
</xs:element>
<?xml version="1.0" encoding="UTF-8"?>

<person>
  <firstname>Hege</firstname>
  <lastname>Refsnes</lastname>
  <children>
    <childname>Cecilie</childname>
  </children>
</person>

<person>
  <firstname>Stale</firstname>
  <lastname>Refsnes</lastname>
</person>

上述 XML 文件是有效的,因为模式 family.xsd 允许我们在 lastname 元素后面添加一个可选元素。

<any><anyAttribute> 元素用于创建可扩展文档!它们允许文档包含未在主 XML 模式中声明的附加元素。

<xs:element name="name" type="xs:string"/>
<xs:element name="navn" substitutionGroup="name"/>

<xs:complexType name="custinfo">
  <xs:sequence>
    <xs:element ref="name"/>
  </xs:sequence>
</xs:complexType>

<xs:element name="customer" type="custinfo"/>
<xs:element name="kunde" substitutionGroup="customer"/>

根据上述模式,一个有效的 XML 文档可能如下所示:

<customer>
  <name>John Smith</name>
</customer>

或者像这样

<kunde>
  <navn>John Smith</navn>
</kunde>

阻止元素替代

要防止其他元素替代指定元素,使用 block 属性:

<xs:element name="name" type="xs:string" block="substitution"/>

看看这个 XML 模式的片段:

<xs:element name="name" type="xs:string" block="substitution"/>
<xs:element name="navn" substitutionGroup="name"/>

<xs:complexType name="custinfo">
  <xs:sequence>
    <xs:element ref="name"/>
  </xs:sequence>
</xs:complexType>

<xs:element name="customer" type="custinfo" block="substitution"/>
<xs:element name="kunde" substitutionGroup="customer"/>

根据上述模式,一个有效的 XML 文档看起来像这样:

<customer>
  <name>John Smith</name>
</customer>

但以下不再有效:

<kunde>
  <navn>John Smith</navn>
</kunde>

使用 substitutionGroup

可替代元素的类型必须与头元素的类型相同,或者派生自头元素的类型。如果可替代元素的类型与头元素的类型相同,则无需指定可替代元素的类型。

请注意,替代组中的所有元素(头元素和可替代元素)必须声明为全局元素,否则将无法正常工作!

什么是全局元素

全局元素是直接作为 "schema" 元素的子元素的元素!局部元素是嵌套在其他元素中的元素。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

相关文章
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
XML JSON 数据可视化
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
本文详细介绍了不同数据集格式之间的转换方法,包括YOLO、VOC、COCO、JSON、TXT和PNG等格式,以及如何可视化验证数据集。
63 1
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
存储 搜索推荐 数据库
运用LangChain赋能企业规章制度制定:深入解析Retrieval-Augmented Generation(RAG)技术如何革新内部管理文件起草流程,实现高效合规与个性化定制的完美结合——实战指南与代码示例全面呈现
【10月更文挑战第3天】构建公司规章制度时,需融合业务实际与管理理论,制定合规且促发展的规则体系。尤其在数字化转型背景下,利用LangChain框架中的RAG技术,可提升规章制定效率与质量。通过Chroma向量数据库存储规章制度文本,并使用OpenAI Embeddings处理文本向量化,将现有文档转换后插入数据库。基于此,构建RAG生成器,根据输入问题检索信息并生成规章制度草案,加快更新速度并确保内容准确,灵活应对法律与业务变化,提高管理效率。此方法结合了先进的人工智能技术,展现了未来规章制度制定的新方向。
34 3
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
1月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器
|
2月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器

推荐镜像

更多