1 XML概述
什么是XML
英文:Xtensible Markup Language 可扩展的标记语言,由各种标记(标签,元素)组成。
可扩展:所有的标签都是自定义的,可以随意扩展的。如:<abc/>,<姓名>
标记语言:整个文档由各种标签组成。清晰,数据结构化!
XML是通用格式标准,全球所有的技术人员都知道这个东西,都会按照XML的规范存储数据,交互数据!!
XML作用
作用:总体上来说,就是为了存储维护数据的。
数据交换:不同的计算机语言之间,不同的操作系统之间,不同的数据库之间,进行数据交换。
- 配置文件:在后期我们主要用于各种框架的配置文件基本天天见。
比如我们很快会学到连接池:c3p0-config.xml
2 编写第1个XML文件
需求
编写xml文档,用于描述人员信息,person代表一个人员,id是人员的属性代表人员编号。人员信息包括age年龄、name姓名、sex性别信息。
使用Java类去描述:
class Person{ String id; int age; String name; String sex; } Person p = new Person("1","张三",18,"男");
效果
步骤
- 选择当前项目鼠标右键新建
新建一个File命名时,以 .xml结尾。这个文件就是xml文件
编写person.xml文件
<?xml version="1.0" encoding="UTF-8" ?> <peopel> <person> <id>1</id> <name>张三</name> <age>18</age> <sex>男</sex> </person> <person> <id>2</id> <name>李四</name> <age>20</age> <sex>女</sex> </person> </peopel>
- 通过浏览器解析XML的内容
- 注:XML以后通过Java来进行解析,很少直接在浏览器上显示。
3 XML的组成:声明和元素
XML组成
- 声明
- 元素(标签)
- 属性
- 注释
- 转义字符【实体字符】
- CDATA 字符区
文档声明
<?xml version="1.0" encoding="utf-8" ?> 固定格式
- IDEA会自动提示。
- 文档声明必须为<?xml开头,以?>结束
- 文档声明必须从文档的1行1列位置开始,必须在xml文档中的首行首列
- 文档声明中常见的两个属性:
- version:指定XML文档版本。必须属性,这里一般选择1.0;
- encoding:指定当前文档的编码,可选属性,默认值是utf-8;
元素(标签、标记)
格式1: <person> 标签体 </person> 有标签体的标签 格式2: <person/> 没有标签体的标签 (空标签)
- 元素是XML文档中最重要的组成部分;
- 普通元素的结构由开始标签、元素体、结束标签组成。【格式1】
- 元素体:元素体可以是元素,也可以是文本,例如:
<person> 标签中可以包含另一个标签 <name>张三</name> </person>
空元素:空元素只有标签,而没有结束标签,但元素必须自己闭合,例如:
<sex/>
- 元素命名
- 区分大小写
- 不能使用空格,不能使用冒号
- 不建议以XML、xml、Xml开头
- 标签名不能数字开头,可以有数字
- 可以使用下划线
- 可以保持与Java命名标识符一样的规则
- 格式化良好的XML文档,有且仅有一个根元素。
错误演示:
元素没有结束
元素大写小写不一致
xml中多个根
4 XML的组成:属性、注释和转义字符
属性的语法
<person id="110">
- 属性是元素的一部分,它必须出现在元素的开始标签中
- 属性的定义格式:
属性名=“属性值”
,其中属性值必须使用单引或双引号括起来 - 一个元素可以有0~N个属性,但一个元素中不能出现同名属性
- 属性名不能使用空格 , 建议不要使用冒号等特殊字符,且必须以字母开头
建议以Java的标识符定义规则做参考
<person id="123"> <name>张三</name> </person>
注释
<!-- 注释内容 --> <!-- 注释内容 1 注释内容 2 -->
XML的注释与HTML相同,既以<!--
开始,-->
结束。不能嵌套。
Java中注释:
// 单行 /* */ 多行注释 /** */ 文档注释
<!-- 注释内容 -->
<!--<person>注释</person>--> <!-- 快捷键:Ctrl+/ :可以将整行进行注释--> <person>三生三世</person> <!-- 快捷键:Ctrl+Shift+/:局部注释-->
转义字符[实体字符]
XML中的实体字符与HTML一样。因为很多符号已经被文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用实体字符
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gklSSWwR-1687767096552)(imgs/1552353386585-1602337253871.png)]
字符 | 预定义的转义字符 | 说明 |
< | < |
小于(less than) |
> | > |
大于(greater than) |
" | " |
双引号(quotation) |
’ | ' |
单引号(apostrophe) |
& | & |
和号(ampersand ) |
注意:严格地讲,在 XML 中仅有字符 “<“和”&” 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
转义字符应用示例:
假如您在 XML 文档中放置了一个类似 “<” 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:
<message>if salary < 1000 then </message>
为了避免此类错误,需要把字符 “<” 替换为实体引用,就像这样:
<message>if salary < 1000 then</message>
小结
- 属性必须出现在标签哪个位置?
- 和开始标签绑定在一起,书写在开始标签元素的后面
<person id="属性值"> </person>
</person>
1
2
同一个标签是否可以有同名的属性?
不可能。
允许有多个属性,属性之间使用空格分隔,但不能出现相同名称的属性
为什么要有转义字符(实体字符)?
在xml文件中,一些特定的符号已经被xml使用了。例:> & 等
希望在xml文档中,使用特定的符号,需要用:转义字符
< => <
& => &
注释的快捷?
ctrl + /