【Java】Java核心 72:XML (上)

简介: 1 XML概述什么是XML英文:Xtensible Markup Language 可扩展的标记语言,由各种标记(标签,元素)组成。可扩展:所有的标签都是自定义的,可以随意扩展的。如:<abc/>,<姓名>标记语言:整个文档由各种标签组成。清晰,数据结构化!

1 XML概述

什么是XML

英文:Xtensible Markup Language 可扩展的标记语言,由各种标记(标签,元素)组成。

可扩展:所有的标签都是自定义的,可以随意扩展的。如:<abc/>,<姓名>

标记语言:整个文档由各种标签组成。清晰,数据结构化!

XML是通用格式标准,全球所有的技术人员都知道这个东西,都会按照XML的规范存储数据,交互数据!!

XML作用

作用:总体上来说,就是为了存储维护数据的。


数据交换:不同的计算机语言之间,不同的操作系统之间,不同的数据库之间,进行数据交换。

02e3b996602b4840a75b747adbc45f3d.png

  1. 配置文件:在后期我们主要用于各种框架的配置文件基本天天见。

比如我们很快会学到连接池:c3p0-config.xml

897e9373418b4d798aa061fc26a75068.png

2 编写第1个XML文件

需求

编写xml文档,用于描述人员信息,person代表一个人员,id是人员的属性代表人员编号。人员信息包括age年龄、name姓名、sex性别信息。

使用Java类去描述:

class Person{
  String id;
  int age;
  String name;
  String sex;
}
Person p = new Person("1","张三",18,"男");


效果

044896e3f40a494cbdcaa986ea7e8a5f.png

步骤

  1. 选择当前项目鼠标右键新建
    新建一个File命名时,以 .xml结尾。这个文件就是xml文件

e3ccf53954dd46539dbba2a500f83263.png

编写person.xml文件

<?xml version="1.0" encoding="UTF-8" ?>
<peopel>
    <person>
        <id>1</id>
        <name>张三</name>
        <age>18</age>
        <sex>男</sex>
    </person>
    <person>
        <id>2</id>
        <name>李四</name>
        <age>20</age>
        <sex>女</sex>
    </person>
</peopel>
  1. 通过浏览器解析XML的内容
  • 注:XML以后通过Java来进行解析,很少直接在浏览器上显示。


3 XML的组成:声明和元素

XML组成

  1. 声明
  2. 元素(标签)
  3. 属性
  4. 注释
  5. 转义字符【实体字符】
  6. CDATA 字符区

文档声明

<?xml version="1.0" encoding="utf-8" ?>    固定格式
  1. IDEA会自动提示。
  2. 文档声明必须为<?xml开头,以?>结束
  3. 文档声明必须从文档的1行1列位置开始,必须在xml文档中的首行首列

4387273d6a424e1ea37056c7367358af.png

  1. 文档声明中常见的两个属性:
  • version:指定XML文档版本。必须属性,这里一般选择1.0;
  • encoding:指定当前文档的编码,可选属性,默认值是utf-8;

元素(标签、标记)

格式1:  <person> 标签体 </person>   有标签体的标签
格式2:  <person/>  没有标签体的标签 (空标签)
  1. 元素是XML文档中最重要的组成部分;
  2. 普通元素的结构由开始标签、元素体、结束标签组成。【格式1】
  3. 元素体:元素体可以是元素,也可以是文本,例如:
<person> 
  标签中可以包含另一个标签  
  <name>张三</name>  
</person>

空元素:空元素只有标签,而没有结束标签,但元素必须自己闭合,例如:

<sex/>
  1. 元素命名
  • 区分大小写
  • 不能使用空格,不能使用冒号
  • 不建议以XML、xml、Xml开头
  • 标签名不能数字开头,可以有数字
  • 可以使用下划线
  1. 可以保持与Java命名标识符一样的规则
  2. 格式化良好的XML文档,有且仅有一个根元素。

错误演示:

元素没有结束

00e0d0e19b654d5aaaf1d8de612d0dfd.png

元素大写小写不一致

f2f81b7407cd4c8d952028d38a01377f.png

xml中多个根

98644ca7f6b74dc0bbe1a1b4c6b5abdd.png

4 XML的组成:属性、注释和转义字符

属性的语法

<person id="110">
  1. 属性是元素的一部分,它必须出现在元素的开始标签中
  2. 属性的定义格式:属性名=“属性值”,其中属性值必须使用单引或双引号括起来
  3. 一个元素可以有0~N个属性,但一个元素中不能出现同名属性


a7dae1784da04e8b9ab3afbefb4beb0c.png

  1. 属性名不能使用空格 , 建议不要使用冒号等特殊字符,且必须以字母开头
    建议以Java的标识符定义规则做参考
<person id="123">
  <name>张三</name>
</person>


注释

<!-- 注释内容 -->
<!-- 
注释内容 1
注释内容 2
-->

XML的注释与HTML相同,既以<!--开始,-->结束。不能嵌套。

Java中注释:

// 单行
/* */ 多行注释
/** */ 文档注释

XML注释

<!-- 注释内容 -->
<!--<person>注释</person>-->  <!-- 快捷键:Ctrl+/ :可以将整行进行注释-->
<person>三生三世</person> <!-- 快捷键:Ctrl+Shift+/:局部注释-->

转义字符[实体字符]

XML中的实体字符与HTML一样。因为很多符号已经被文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用实体字符


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gklSSWwR-1687767096552)(imgs/1552353386585-1602337253871.png)]

字符 预定义的转义字符 说明
< &lt; 小于(less than)
> &gt; 大于(greater than)
" &quot; 双引号(quotation)
&apos; 单引号(apostrophe)
& &amp; 和号(ampersand )

注意:严格地讲,在 XML 中仅有字符 “<“和”&” 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

转义字符应用示例:

假如您在 XML 文档中放置了一个类似 “<” 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:

<message>if salary < 1000 then </message>

为了避免此类错误,需要把字符 “<” 替换为实体引用,就像这样:

<message>if salary &lt; 1000 then</message>

小结

  1. 属性必须出现在标签哪个位置?
  • 和开始标签绑定在一起,书写在开始标签元素的后面
<person id="属性值">
</person>

</person>

1

2

同一个标签是否可以有同名的属性?


不可能。

允许有多个属性,属性之间使用空格分隔,但不能出现相同名称的属性

为什么要有转义字符(实体字符)?


在xml文件中,一些特定的符号已经被xml使用了。例:> & 等

希望在xml文档中,使用特定的符号,需要用:转义字符

< => &lt;

& => &amp;

注释的快捷?


ctrl + /

相关文章
|
3月前
|
XML 数据采集 存储
使用Java和XPath在XML文档中精准定位数据
在数据驱动的时代,从复杂结构中精确提取信息至关重要。XML被广泛用于数据存储与传输,而XPath则能高效地在这些文档中导航和提取数据。本文深入探讨如何使用Java和XPath精准定位XML文档中的数据,并通过小红书的实际案例进行分析。首先介绍了XML及其挑战,接着阐述了XPath的优势。然后,提出从大型XML文档中自动提取特定产品信息的需求,并通过代理IP技术、设置Cookie和User-Agent以及多线程技术来解决实际网络环境下的数据抓取问题。最后,提供了一个Java示例代码,演示如何集成这些技术以高效地从XML源中抓取数据。
116 7
使用Java和XPath在XML文档中精准定位数据
|
3月前
|
XML JavaScript Java
【JAVA XML 探秘】DOM、SAX、StAX:揭秘 Java 中 XML 解析技术的终极指南!
【8月更文挑战第25天】本文详细探讨了Java中三种主流的XML解析技术:DOM、SAX与StAX。DOM将XML文档转换为树状结构,便于全方位访问和修改;SAX采取事件驱动模式,适用于大型文件的顺序处理;StAX则兼具DOM和SAX的优点,支持流式处理和随机访问。文中提供了每种技术的示例代码,帮助读者理解如何在实际项目中应用这些解析方法。
158 1
|
5月前
|
XML Java 数据格式
必知的技术知识:java基础73dom4j修改xml里面的内容(网页知识)
必知的技术知识:java基础73dom4j修改xml里面的内容(网页知识)
39 1
|
1月前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
72 4
|
1月前
|
XML JavaScript Java
java与XML文件的读写
java与XML文件的读写
24 3
|
5月前
|
XML Java 数据格式
java修改XML
java修改XML
|
5月前
|
XML Java 数据格式
java创建xml文件内容
java创建xml文件内容
|
3月前
|
XML 存储 JavaScript
在 Java 中如何将 ArrayList 转换为 XML
【8月更文挑战第23天】
30 3
|
3月前
|
C# 前端开发 UED
WPF数据验证实战:内置控件与自定义规则,带你玩转前端数据验证,让你的应用程序更上一层楼!
【8月更文挑战第31天】在WPF应用开发中,数据验证是确保输入正确性的关键环节。前端验证能及时发现错误,提升用户体验和程序可靠性。本文对比了几种常用的WPF数据验证方法,并通过示例展示了如何使用内置验证控件(如`TextBox`)及自定义验证规则实现有效验证。内置控件结合`Validation`类可快速实现简单验证;自定义规则则提供了更灵活的复杂逻辑支持。希望本文能帮助开发者更好地进行WPF数据验证。
106 0
|
3月前
|
XML 自然语言处理 Java
Java 中的 XML 数据绑定
【8月更文挑战第22天】
26 0