XML Schema 复杂元素类型详解:定义及示例解析

简介: 在XML Schema(XSD)中,复杂元素包含其他元素和/或属性,分为4类:空元素、仅含元素、仅含文本和既含元素也含文本。定义复杂元素可通过直接声明或引用预定义的复杂类型。复杂空元素仅含属性,而仅含元素的类型则只包含其他子元素。XSD提供了`<xs:sequence>`、`<xs:all>`、`<xs:choice>`等指示器来规定元素顺序和出现次数,以及`<xs:attributeGroup>`和`<xs:group>`来组织元素和属性。

在XML Schema(XSD)中,复杂元素是指包含其他元素和/或属性的XML元素。复杂元素可以分为四种类型:

  1. 空元素: 仅包含其他元素和/或属性的元素。
  2. 仅包含其他元素的元素: 不包含文本内容,只包含其他子元素的元素。
  3. 仅包含文本的元素: 不包含其他子元素,只包含文本内容的元素。
  4. 既包含其他元素又包含文本的元素: 同时包含其他子元素和文本内容的元素。

以下是复杂元素的一些示例:

  • 空元素:
<product pid="1345"/>
  • 仅包含其他元素的元素:
<employee>
  <firstname>John</firstname>
  <lastname>Smith</lastname>
</employee>
  • 仅包含文本的元素:
<food type="dessert">Ice cream</food>
  • 既包含其他元素又包含文本的元素:
<description>
It happened on <date lang="norwegian">03.03.99</date> ....
</description>

在XML Schema中,可以通过以下两种方式定义复杂元素:

  1. 使用<xs:element>元素直接声明元素,并在其中定义复杂类型。例如:
<xs:element name="employee">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>
  1. 使用<xs:complexType>元素定义复杂类型,然后在需要的地方引用该类型。例如:
<xs:element name="employee" type="personinfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

您还可以基于现有的复杂类型创建新的复杂类型,并在其中添加额外的元素,如上面的第二个示例所示。

<xs:element name="employee" type="fullpersoninfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

<xs:complexType name="fullpersoninfo">
  <xs:complexContent>
    <xs:extension base="personinfo">
      <xs:sequence>
        <xs:element name="address" type="xs:string"/>
        <xs:element name="city" type="xs:string"/>
        <xs:element name="country" type="xs:string"/>
      </xs:sequence>
    </xs:extension>
  </xs:complexContent>
</xs:complexType>

一个空的复杂元素在XML中不包含内容,只能包含属性。以下是关于XSD中空元素的一些说明和示例:

复杂空元素

一个空的XML元素示例:

<product prodid="1345" />

在上面的示例中,"product"元素没有任何内容,只有一个名为"prodid"的属性。

在XSD中定义一个空元素需要遵循以下步骤:

  1. 使用<xs:element>元素定义元素。
  2. 使用<xs:complexType>元素定义复杂类型。
  3. 使用<xs:complexContent>元素指定内容模型。
  4. 使用<xs:restriction>元素基于基本类型(如整数)定义限制。
  5. 使用<xs:attribute>元素定义属性。

以下是一个定义空元素的XSD示例:

<xs:element name="product">
  <xs:complexType>
    <xs:complexContent>
      <xs:restriction base="xs:integer">
        <xs:attribute name="prodid" type="xs:positiveInteger"/>
      </xs:restriction>
    </xs:complexContent>
  </xs:complexType>
</xs:element>

但是,您也可以更简洁地定义空元素,如下所示:

<xs:element name="product">
  <xs:complexType>
    <xs:attribute name="prodid" type="xs:positiveInteger"/>
  </xs:complexType>
</xs:element>

或者,您可以给复杂类型指定一个名称,并将"type"属性设置为该名称,如下所示:

<xs:element name="product" type="prodtype"/>

<xs:complexType name="prodtype">
  <xs:attribute name="prodid" type="xs:positiveInteger"/>
</xs:complexType>

仅包含元素的复杂类型

一个"仅包含元素"的复杂类型包含一个只包含其他元素的元素。

例如,以下是一个包含仅包含其他元素的XML元素 "person" 的示例:

<person>
  <firstname>John</firstname>
  <lastname>Smith</lastname>
</person>

您可以使用<xs:sequence>元素在模式中定义 "person" 元素,如下所示:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

在上述示例中,<xs:sequence>元素表示在 "person" 元素内部定义的元素("firstname" 和 "lastname")必须按照该顺序出现。

或者,您也可以给复杂类型指定一个名称,并将"type"属性设置为该名称,如下所示:

<xs:element name="person" type="persontype"/>

<xs:complexType name="persontype">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

在上述示例中,我们将复杂类型的名称设置为"persontype",然后将"type"属性设置为该名称,以便多个元素可以引用相同的复杂类型。

注意:为了允许字符数据出现在 "letter" 的子元素之间,必须将 mixed 属性设置为 "true"。<xs:sequence> 标签表示定义的元素(name、orderid 和 shipdate)必须以该顺序出现在 "letter" 元素内

我们还可以给 complexType 元素一个名称,并让 "letter" 元素具有指向 complexType 名称的 type 属性(如果使用此方法,多个元素可以引用相同的复杂类型):

<xs:element name="letter" type="lettertype"/>

<xs:complexType name="lettertype" mixed="true">
  <xs:sequence>
    <xs:element name="name" type="xs:string"/>
    <xs:element name="orderid" type="xs:positiveInteger"/>
    <xs:element name="shipdate" type="xs:date"/>
  </xs:sequence>
</xs:complexType>

XSD 指示器
我们可以使用指示器来控制文档中元素的使用方式。

指示器
有七个指示器:

顺序指示器:

  • All
  • Choice
  • Sequence

出现指示器:

  • maxOccurs
  • minOccurs

组指示器:

  • 组名称
  • 属性组名称

顺序指示器
顺序指示器用于定义元素的顺序。

All 指示器
<all> 指示器指定子元素可以以任何顺序出现,并且每个子元素只能出现一次:

<xs:element name="person">
  <xs:complexType>
    <xs:all>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:all>
  </xs:complexType>
</xs:element>

注意:在使用 <all> 指示器时,您可以将 <minOccurs> 指示器设置为 0 或 1,并且 <maxOccurs> 指示器只能设置为 1(有关 <minOccurs><maxOccurs> 的说明稍后描述)。

Choice 指示器
<choice> 指示器指定可以出现一个子元素或另一个子元素:

<xs:element name="person">
  <xs:complexType>
    <xs:choice>
      <xs:element name="employee" type="employee"/>
      <xs:element name="member" type="member"/>
    </xs:choice>
  </xs:complexType>
</xs:element>

Sequence 指示器
<sequence> 指示器指定子元素必须以特定顺序出现:

<xs:element name="person">
   <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

出现指示器
出现指示器用于定义元素可以出现的次数。

注意:对于所有的 "顺序" 和 "组" 指示器(all、choice、sequence、组名称和组引用),maxOccurs 和 minOccurs 的默认值为 1。

maxOccurs 指示器
<maxOccurs> 指示器指定元素可以出现的最大次数:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="full_name" type="xs:string"/>
      <xs:element name="child_name" type="xs:string" maxOccurs="10"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

上面的示例指示了在 "person" 元素中,"child_name" 元素可以出现最少一次(minOccurs 的默认值为 1),最多出现十次。

minOccurs 指示器
<minOccurs> 指示器指定元素可以出现的最小次数:

<xs:element name="person">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="full_name" type="xs:string"/>
      <xs:element name="child_name" type="xs:string"
      maxOccurs="10" minOccurs="0"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

上面的示例指示了在 "person" 元素中,"child_name" 元素可以出现最少零次,最多出现十次。

提示:要允许元素出现无限次数,使用 maxOccurs="unbounded" 语句:

<xs:element name="child_name" type="xs:string" maxOccurs="unbounded"/>

一个工作示例:

名为 Myfamily.xml 的 XML 文件:

<?xml version="1.0" encoding="UTF-8"?>

<persons xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="family.xsd">

<person>
  <full_name>Hege Refsnes</full_name>
  <child_name>Cecilie</child_name>
</person>

<person>
  <full_name>Tove Refsnes</full_name>
  <child_name>Hege</child_name>
  <child_name>Stale</child_name>
  <child_name>Jim</child_name>
  <child_name>Borge</child_name>
</person>

<person>
  <full_name>Stale Refsnes</full_name>
</person>

</persons>

上面的 XML 文件包含一个名为 "persons" 的根元素。在这个根元素内,我们定义了三个 "person" 元素。每个 "person" 元素必须包含一个 "full_name" 元素,最多可以包含五个 "child_name" 元素。

以下是模式文件 family.xsd

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified">

<xs:element name="persons">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="person" maxOccurs="unbounded">
        <xs:complexType>
          <xs:sequence>
            <xs:element name="full_name" type="xs:string"/>
            <xs:element name="child_name" type="xs:string"
            minOccurs="0" maxOccurs="5"/>
          </xs:sequence>
        </xs:complexType>
      </xs:element>
    </xs:sequence>
  </xs:complexType>
</xs:element>

</xs:schema>

组指示器
组指示器用于定义相关的元素集合。

元素组
元素组使用 group 声明来定义,如下所示:

<xs:group name="groupname">
...
</xs:group>

您必须在组声明中定义 all、choice 或 sequence 元素。以下示例定义了一个名为 "persongroup" 的组,该组定义了必须以精确顺序出现的一组元素:

<xs:group name="persongroup">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
    <xs:element name="birthday" type="xs:date"/>
  </xs:sequence>
</xs:group>

在定义了组之后,您可以在另一个定义中引用它,如下所示:

<xs:group name="persongroup">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
    <xs:element name="birthday" type="xs:date"/>
  </xs:sequence>
</xs:group>

<xs:element name="person" type="personinfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:group ref="persongroup"/>
    <xs:element name="country" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

属性组

属性组使用 attributeGroup 声明来定义,如下所示:

<xs:attributeGroup name="groupname">
...
</xs:attributeGroup>

以下示例定义了一个名为 "personattrgroup" 的属性组:

<xs:attributeGroup name="personattrgroup">
  <xs:attribute name="firstname" type="xs:string"/>
  <xs:attribute name="lastname" type="xs:string"/>
  <xs:attribute name="birthday" type="xs:date"/>
</xs:attributeGroup>

在定义了属性组之后,您可以在另一个定义中引用它,如下所示:

<xs:attributeGroup name="personattrgroup">
  <xs:attribute name="firstname" type="xs:string"/>
  <xs:attribute name="lastname" type="xs:string"/>
  <xs:attribute name="birthday" type="xs:date"/>
</xs:attributeGroup>

<xs:element name="person">
  <xs:complexType>
    <xs:attributeGroup ref="personattrgroup"/>
  </xs:complexType>
</xs:element>
<?xml version="1.0" encoding="UTF-8"?>

<person>
  <firstname>Hege</firstname>
  <lastname>Refsnes</lastname>
  <children>
    <childname>Cecilie</childname>
  </children>
</person>

<person>
  <firstname>Stale</firstname>
  <lastname>Refsnes</lastname>
</person>

上述 XML 文件是有效的,因为模式 family.xsd 允许我们在 lastname 元素后面添加一个可选元素。

<any><anyAttribute> 元素用于创建可扩展文档!它们允许文档包含未在主 XML 模式中声明的附加元素。

<xs:element name="name" type="xs:string"/>
<xs:element name="navn" substitutionGroup="name"/>

<xs:complexType name="custinfo">
  <xs:sequence>
    <xs:element ref="name"/>
  </xs:sequence>
</xs:complexType>

<xs:element name="customer" type="custinfo"/>
<xs:element name="kunde" substitutionGroup="customer"/>

根据上述模式,一个有效的 XML 文档可能如下所示:

<customer>
  <name>John Smith</name>
</customer>

或者像这样

<kunde>
  <navn>John Smith</navn>
</kunde>

阻止元素替代

要防止其他元素替代指定元素,使用 block 属性:

<xs:element name="name" type="xs:string" block="substitution"/>

看看这个 XML 模式的片段:

<xs:element name="name" type="xs:string" block="substitution"/>
<xs:element name="navn" substitutionGroup="name"/>

<xs:complexType name="custinfo">
  <xs:sequence>
    <xs:element ref="name"/>
  </xs:sequence>
</xs:complexType>

<xs:element name="customer" type="custinfo" block="substitution"/>
<xs:element name="kunde" substitutionGroup="customer"/>

根据上述模式,一个有效的 XML 文档看起来像这样:

<customer>
  <name>John Smith</name>
</customer>

但以下不再有效:

<kunde>
  <navn>John Smith</navn>
</kunde>

使用 substitutionGroup

可替代元素的类型必须与头元素的类型相同,或者派生自头元素的类型。如果可替代元素的类型与头元素的类型相同,则无需指定可替代元素的类型。

请注意,替代组中的所有元素(头元素和可替代元素)必须声明为全局元素,否则将无法正常工作!

什么是全局元素

全局元素是直接作为 "schema" 元素的子元素的元素!局部元素是嵌套在其他元素中的元素。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

相关文章
|
11月前
|
机器学习/深度学习 存储 算法
【LeetCode 热题100】347:前 K 个高频元素(详细解析)(Go语言版)
这篇文章详细解析了力扣热题 347——前 K 个高频元素的三种解法:哈希表+小顶堆、哈希表+快速排序和哈希表+桶排序。每种方法都附有清晰的思路讲解和 Go 语言代码实现。小顶堆方法时间复杂度为 O(n log k),适合处理大规模数据;快速排序方法时间复杂度为 O(n log n),适用于数据量较小的场景;桶排序方法在特定条件下能达到线性时间复杂度 O(n)。文章通过对比分析,帮助读者根据实际需求选择最优解法,并提供了完整的代码示例,是一篇非常实用的算法学习资料。
665 90
|
存储 Java
深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。
【10月更文挑战第16天】本文深入探讨了Java集合框架中的HashSet和TreeSet,解析了两者在元素存储上的无序与有序特性。HashSet基于哈希表实现,添加元素时根据哈希值分布,遍历时顺序不可预测;而TreeSet利用红黑树结构,按自然顺序或自定义顺序存储元素,确保遍历时有序输出。文章还提供了示例代码,帮助读者更好地理解这两种集合类型的使用场景和内部机制。
203 3
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
308 3
|
算法 测试技术 C语言
深入理解HTTP/2:nghttp2库源码解析及客户端实现示例
通过解析nghttp2库的源码和实现一个简单的HTTP/2客户端示例,本文详细介绍了HTTP/2的关键特性和nghttp2的核心实现。了解这些内容可以帮助开发者更好地理解HTTP/2协议,提高Web应用的性能和用户体验。对于实际开发中的应用,可以根据需要进一步优化和扩展代码,以满足具体需求。
1140 29
|
JSON 前端开发 搜索推荐
关于商品详情 API 接口 JSON 格式返回数据解析的示例
本文介绍商品详情API接口返回的JSON数据解析。最外层为`product`对象,包含商品基本信息(如id、name、price)、分类信息(category)、图片(images)、属性(attributes)、用户评价(reviews)、库存(stock)和卖家信息(seller)。每个字段详细描述了商品的不同方面,帮助开发者准确提取和展示数据。具体结构和字段含义需结合实际业务需求和API文档理解。
|
人工智能 文字识别 自然语言处理
保单AI识别技术及代码示例解析
车险保单包含基础信息、车辆信息、人员信息、保险条款及特别约定等关键内容。AI识别技术通过OCR、文档结构化解析和数据校验,实现对保单信息的精准提取。然而,版式多样性、信息复杂性、图像质量和法律术语解析是主要挑战。Python代码示例展示了如何使用PaddleOCR进行保单信息抽取,并提出了定制化训练、版式分析等优化方向。典型应用场景包括智能录入、快速核保、理赔自动化等。未来将向多模态融合、自适应学习和跨区域兼容性发展。
|
JSON 缓存 API
解析电商商品详情API接口系列,json数据示例参考
电商商品详情API接口是电商平台的重要组成部分,提供了商品的详细信息,支持用户进行商品浏览和购买决策。通过合理的API设计和优化,可以提升系统性能和用户体验。希望本文的解析和示例能够为开发者提供参考,帮助构建高效、可靠的电商系统。
530 12
|
数据采集 Web App开发 JavaScript
DOMParser解析TikTok页面中的图片元素
DOMParser解析TikTok页面中的图片元素
|
安全 编译器 Linux
深入解析与防范:基于缓冲区溢出的FTP服务器攻击及调用计算器示例
本文深入解析了利用缓冲区溢出漏洞对FTP服务器进行远程攻击的技术,通过分析FreeFlow FTP 1.75版本的漏洞,展示了如何通过构造过长的用户名触发缓冲区溢出并调用计算器(`calc.exe`)。文章详细介绍了攻击原理、关键代码组件及其实现步骤,并提出了有效的防范措施,如输入验证、编译器保护和安全编程语言的选择,以保障系统的安全性。环境搭建基于Windows XP SP3和Kali Linux,使用Metasploit Framework进行攻击演示。请注意,此内容仅用于教育和研究目的。
494 4
|
缓存 监控 网络协议
一文带你了解10大DNS攻击类型,收藏!
【10月更文挑战第23天】
3517 1
一文带你了解10大DNS攻击类型,收藏!

推荐镜像

更多
  • DNS