关于XML文档的讲解

简介:
1        XML的概述

1.1 什么是XML

XML全称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。

W3C在1998年2月发布1.0版本,2004年2月又发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!

1.2 XML的应用场景

  保存关系型数据:

复制代码
  <student number="1001">
        <name>zhangSan</name>
        <age>23</age>
        <sex>male</sex>
                <teacher name=”liSi”>
                   <wife id=”xxx”><name>xxx</name></wife>
                </teacher>
       </student>
    
复制代码

配置文件:

  <servlet>
        <servlet-name>MyServlet</servlet-name>
        <servlet-class>cn.itcast.servlet.MyServlet</servlet-class>
    </servlet>

l  在一个软件系统中,为提高系统的灵活性,它所启动的模块通常由其配置文件决定

l  例如一个软件在启动时,它需要启动A、B两个模块,而A、B这两个模块在启动时,又分别需要A1、A2和B1、B2模块的支持,为了准确描述这种关系,此时使用XML文件最为合适不过。

 

来看一个XML文档

students.xml

复制代码
<?xml version="1.0" encoding="utf-8" standalone="no"?>
<students>    
    <student number="1001">
        <name>zhangSan</name>
        <age>23</age>
        <sex>male</sex>
    </student>
    <student number="1002">
        <name>liSi</name>
        <age>32</age>
        <sex>female</sex>
    </student>
    <student number="1003">
        <name>wangWu</name>
        <age>55</age>
        <sex>male</sex>
    </student>
</students>
复制代码

2.1 XML文档声明

l  文档声明必须为<?xml开头,以?>结束;

l  文档声明必须从文档的0行0列位置开始;

l  文档声明只有三个属性:

  • versioin:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
  • encoding:指定当前文档的编码。可选属性,默认值是utf-8;
  • standalone:指定文档独立性。可选属性,默认值为yes,表示当前文档是独立文档。如果为no表示当前文档不是独立的文档,会依赖外部文件。

l  一个XML文件分为如下几部分内容:

l  文档声明

l  元素

l  属性

l  注释 

l  CDATA区 、特殊字符 

l  处理指令(processing instruction)

XML语法-文档声明

l  在编写XML文档时,需要先使用文档声明,声明XML文档的类型。

l  最简单的声明语法:

                <?xml version="1.0" ?>

l  用encoding属性说明文档的字符编码:

                <?xml version="1.0" encoding="GB2312" ?> 

l  用standalone属性说明文档是否独立:

                <?xml version="1.0" encoding="GB2312"  standalone="yes" ?>

 

2.2 元素

元素是XML文档中最重要的组成部分:

l  普通元素的结构:开始标签、元素体、结束标签,例如:<hello>大家好</hello>;

l  元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>,其中<b>元素的元素体是<a>元素,而<a>元素的元素体是文本;

l  空元素:空元素只有开始标签,而没有结束标签,例如:<c/>,当元素必须自己闭合。

 

3 属性
复制代码
                <student number="1001">

                                <name>zhangSan</name>

                                <age>23</age>

                                <sex>male</sex>

                </student>
复制代码

 

l  属性是元素的一部分,它必须出现在元素的开始标签中;

l  属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引;

l  一个元素可以有0~N个属性,但一个元素中不能出现同名属性;

 

4 注释

  XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!

5 转义字符和CDATA段<![CDATA[
]]>

5.1 转义字符

XML中的转义字符与HTML一样。

因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。

 

例如:<a>&lt;hello&gt;</a>,<a>元素内部会被解释为:<hello>!

5.2 CDATA段

当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

在CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。

<a><![CDATA[<a>]]></a>

在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。

6 处理指令(了解即可)

处理指令,简称PI(Processing instruction)。处理指令用来指挥解析器如何解析XML文档内容。

例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析器,应用css文件显示xml文档内容。 

<?xml-stylesheet type="text/css" href="a.css"?>

处理指令以“<?”开头,以“?>”结束,这一点与xml文档声明相同。

复制代码
gj1 {font-size: 200px; color: red;}
gj2 {font-size: 100px; color: green;}
gj3 {font-size: 10px;}
gj4 {font-size: 50px; color: blue;}
<?xml version="1.0" encoding="gbk"?>
<?xml-stylesheet type="text/css" href="a.css" ?> 
<gjm>
  <gj1>中国</gj1>
  <gj2>美国</gj2>
  <gj3>日本</gj3>
  <gj4>英国</gj4>
</gjm>
复制代码
7 格式良好的XML文档

格式良好的XML就是格式正确的XML文档,只有XML的格式是良好的,XML解释器才能解释它。下面是对格式良好XML文档的要求:

l  必须要有XML文档声明;

l  必须且仅能有一个根元素;

l  元素和属性的命名必须遵循XML要求:

  • XML命名区分大小写,例如<a>和<A>是两个不同的元素;
  • 名称中可以包含:字母、数字、下划线、减号,但不能以数字、减号开头;
  • 不能以xml开头,无论是大写还是小写都不可以,例如<xml>、<Xml>、<XML>都是错误的;
  • 不能包含空格,例如<ab cd>是错误的。

l  元素之间必须合理包含,例如:<a><b>xxx</b></a>是合理的,而<a><b>xxx</a></b>就是错误的包含。

 


本文转自SummerChill博客园博客,原文链接:http://www.cnblogs.com/DreamDrive/p/4184338.html,如需转载请自行联系原作者

相关文章
|
6月前
|
XML 存储 JavaScript
DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧
**XML DOM 遍历、操作和导航概述** - 遍历XML节点树用于提取信息,例如,通过JavaScript的DOM API循环`&lt;book&gt;`子节点显示名称和值。 - DOM解析器处理XML文本数据,包括解析字符数据(PCDATA)和识别CDATA段。 - 节点导航涉及`parentNode`、`childNodes`等属性,`get_nextSibling`等辅助函数避免空文本节点。 - `getElementsByTagName`、`getAttribute`和`nodeValue`用于检索元素、属性值和文本。
89 6
DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧
|
XML 数据格式
hutool将XML文档转换为String
hutool将XML文档转换为String
|
3月前
|
XML 数据采集 存储
使用Java和XPath在XML文档中精准定位数据
在数据驱动的时代,从复杂结构中精确提取信息至关重要。XML被广泛用于数据存储与传输,而XPath则能高效地在这些文档中导航和提取数据。本文深入探讨如何使用Java和XPath精准定位XML文档中的数据,并通过小红书的实际案例进行分析。首先介绍了XML及其挑战,接着阐述了XPath的优势。然后,提出从大型XML文档中自动提取特定产品信息的需求,并通过代理IP技术、设置Cookie和User-Agent以及多线程技术来解决实际网络环境下的数据抓取问题。最后,提供了一个Java示例代码,演示如何集成这些技术以高效地从XML源中抓取数据。
106 7
使用Java和XPath在XML文档中精准定位数据
|
6月前
|
XML 存储 C#
C# xml文档反序列化记事
本文介绍了使用XmlSerializer进行XML序列化和反序列化的关键点。包括:1) 以独占方式读取XML文件以避免并发问题;2) 当元素名与类型名不一致时,可通过`[XmlArrayItem]`指定元素名,或创建继承自原始类型的子类;3) 处理DateTime反序列化错误,通过中间字符串属性转换;4) 提到了常用C#特性如`[XmlRoot]`, `[XmlElement]`, `[XmlAttribute]`, `[XmlIgnore]`和`[XmlArrayItem]`的作用。
|
6月前
|
XML JavaScript 数据格式
XML Schema(XSD)详解:定义 XML 文档结构合法性的完整指南
XML Schema(XSD)是用于定义XML文档结构的规范,它描述了元素、属性及其顺序、数据类型和约束。与DTD相比,XML Schema支持更多数据类型,如字符串、日期等,并且是基于XML的,允许扩展和重用。学习XML Schema有助于确保数据通信时双方对内容的理解一致,通过验证防止错误。示例展示了如何定义一个`note`元素,包含`to`, `from`, `heading`和`body`子元素,都是字符串类型。XML文档可以通过引用XML Schema进行验证,确保内容符合预设模式。
471 0
|
6月前
|
XML JavaScript 前端开发
XML文档节点导航与选择指南
XPath是XSLT的核心部分,用于XML文档的节点定位和选择。它采用路径表达式语法,包含200多个内置函数处理各种数据类型。XPath在编程语言如JavaScript中广泛使用,与XSLT配合进行XML转换和样式处理。它涉及7种节点类型,如元素、属性和文本,以及多种节点间关系,如父、子、同级等。XPath还使用轴(如ancestor、child)来描述节点间的关联,并支持运算符进行逻辑和数学操作。
77 0
XML文档节点导航与选择指南
|
6月前
|
XML 存储 数据格式
探索 DTD 在 XML 中的作用及解析:深入理解文档类型定义
DTD(文档类型定义)用于定义XML文档的结构和合法元素、属性。它允许不同团体就数据交换标准达成一致,并用于验证XML数据的有效性。DTD可通过内部声明(在XML文档内)或外部声明(在单独文件中)来定义。内部声明示例显示了如何定义`note`元素及其子元素的结构,而外部声明则引用外部DTD文件。元素、属性、实体和PCDATA/CDATA是XML构建模块。DTD中,元素通过ELEMENT声明定义,属性通过ATTLIST声明定义,实体声明提供特殊字符或外部资源的快捷方式。
110 0
|
XML JavaScript 数据格式
使用Dom4J解析XML文档
XML解析的方式 XML常见的两种解析方式: DOM: 要求解析器将整个XML文件全部加载到内存中,生成一个Document对象 优点:元素和元素之间保留结构、关系,可以针对元素进行增删查改操作 缺点:如果XML文件过大,可能会导致内存溢出 SAX:是一种速度更快,更加高效的解析方式。它是逐行扫描,边扫描边解析,并且以事件驱动的方式来进行具体的解析,每解析一行都会触发一个事件 优点: 不会出现内存溢出的问题,可以处理大文件 缺点:只能读,不能写 概念辨析: 解析器就是根据不同的解析方式提供具体的实现。 为了方便开发人员来解析XML,有一些方便操作的类库。例如Dom4j其中就包含了很多解
107 0
|
XML Java 数据格式
关于使用JAXB读取xml文档转换为java对象出现非法注解异常
关于使用JAXB读取xml文档转换为java对象出现非法注解异常
关于使用JAXB读取xml文档转换为java对象出现非法注解异常
|
XML 存储 消息中间件
Tsung MQTT协议简介及MQTT xml文档配置介绍
Tsung MQTT协议简介及MQTT xml文档配置介绍
156 0