【JavaSE】Java基础语法(四十四):XML解析

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 1. 概述万维网联盟(W3C)万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

1. 概述

  • 万维网联盟(W3C)
    万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。

是Web技术领域最具权威和影响力的国际中立性技术标准机构。

到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,

- 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)

- 可扩展标记语言XML(标准通用标记语言下的一个子集)

- 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等


xml概述

XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言

标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)

可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的


作用

- 用于进行存储数据和传输数据

- 作为软件的配置文件


作为配置文件的优势

- 可读性好

- 可维护性高

2.标签的规则

  • 标签由一对尖括号和合法标识符组成
<student>
• 1
  • 标签必须成对出现
<student> </student>
前边的是开始标签,后边的是结束标签
• 1
• 2

标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来

<student id="1"> </student>

标签需要正确的嵌套

这是正确的: <student id="1"> <name>张三</name> </student>
这是错误的: <student id="1"><name>张三</student></name>


3. 语法规则【应用】

  • 语法规则
  • XML文件的后缀名为:xml

文档声明必须是第一行第一列

version:该属性是必须存在的

encoding:该属性不是必须的

打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

必须存在一个根标签,有且只能有一个

  • XML文件中可以定义注释信息
  • XML文件中可以存在以下特殊字符
&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号
  • XML文件中可以存在CDATA区
  • 示例代码
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息
</info>
<message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>

4. xml解析【应用】

  • 概述
    xml解析就是从xml中获取到数据
  • 常见的解析思想
    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。
    会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

bad9d5c85264483f8aea700204704e4b.png

常见的解析工具

JAXP: SUN公司提供的一套XML的解析的API

JDOM: 开源组织提供了一套XML的解析的API-jdom

DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java

pull: 主要应用在Android手机端解析XML

解析的准备工作


我们可以通过网站:https://dom4j.github.io/ 去下载dom4j

今天的资料中已经提供,我们不用再单独下载了,直接使用即可

将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar

在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中

选中jar包 -> 右键 -> 选择add as library即可

  • 需求
    - 解析提供好的xml文件
    - 将解析到的数据封装到学生对象中
    - 并将学生对象存储到ArrayList集合中
    - 遍历集合
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
  <!--第一个学生信息-->
  <student id="1">
    <name>张三</name>
    <age>23</age>
  </student>
  <!--第二个学生信息-->
  <student id="2">
    <name>李四</name>
    <age>24</age>
  </student>
</students>
public class Student {
  private String id;
  private String name;
  private int age;
  public Student() {
  }
  public Student(String id, String name, int age) {
    this.id = id;
    this.name = name;
    this.age = age;
  }
  public String getId() {
    return id;
  }
  public void setId(String id) {
    this.id = id;
  }
  public String getName() {
    return name;
  }
  public void setName(String name) {
    this.name = name;
  }
  public int getAge() {
    return age;
  }
  public void setAge(int age) {
    this.age = age;
  }
  @Override
  public String toString() {
    return "Student{" +
    "id='" + id + '\'' +
    ", name='" + name + '\'' +
    ", age=" + age +
    '}';
  }
}
/**
* 利用dom4j解析xml文件
*/
public class XmlParse {
  public static void main(String[] args) throws DocumentException {
    //1.获取一个解析器对象
    SAXReader saxReader = new SAXReader();
    //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
    Document document = saxReader.read(new
    File("myxml\\xml\\student.xml"));
    //3.获取到根标签
    Element rootElement = document.getRootElement();
    //4.通过根标签来获取student标签
    //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
    //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集
    合中并返回
    //List list = rootElement.elements();
    List<Element> studentElements = rootElement.elements("student");
    //System.out.println(list.size());
    //用来装学生对象
    ArrayList<Student> list = new ArrayList<>();
    //5.遍历集合,得到每一个student标签
    for (Element element : studentElements) {
      //element依次表示每一个student标签
      //获取id这个属性
      Attribute attribute = element.attribute("id");
      //获取id的属性值
      String id = attribute.getValue();
      //获取name标签
      //element("标签名"):获取调用者指定的子标签
      Element nameElement = element.element("name");
      //获取这个标签的标签体内容
      String name = nameElement.getText();
      //获取age标签
      Element ageElement = element.element("age");
      //获取age标签的标签体内容
      String age = ageElement.getText();
      // System.out.println(id);
      // System.out.println(name);
      // System.out.println(age);
      Student s = new Student(id,name,Integer.parseInt(age));
      list.add(s);
    }
    //遍历操作
    for (Student student : list) {
      System.out.println(student);
    }
  }
}

相关文章
|
4天前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
44 15
|
5月前
|
Java 开发工具 Android开发
Kotlin语法笔记(26) -Kotlin 与 Java 共存(1)
Kotlin语法笔记(26) -Kotlin 与 Java 共存(1)
59 2
|
5月前
|
Java 开发工具 Android开发
Kotlin语法笔记(26) -Kotlin 与 Java 共存(1)
本系列教程笔记详细讲解了Kotlin语法,适合需要深入了解Kotlin的开发者。若需快速学习Kotlin,建议查看“简洁”系列教程。本期重点介绍了Kotlin与Java的共存方式,包括属性、单例对象、默认参数方法、包方法、扩展方法以及内部类和成员的互操作性。通过这些内容,帮助你在项目中更好地结合使用这两种语言。
75 1
|
5天前
|
运维 Cloud Native Java
postman发起post请求遇到报错:java.io.FileNotFoundException (文件名、目录名或卷标语法不正确。)
遇到bug报错,多猜可能的原因,控制变量反复测试,直至找到问题的关键,然后再思考如何解决或者回避。 博客不应该只有代码和解决方案,重点应该在于给出解决方案的同时分享思维模式,只有思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来
|
3月前
|
Java
java do while 的语法怎么用?
java do while 的语法怎么用?
95 3
|
5月前
|
Java 编译器 Android开发
Kotlin语法笔记(28) -Kotlin 与 Java 混编
Kotlin语法笔记(28) -Kotlin 与 Java 混编
84 2
|
5月前
|
Java 编译器 Android开发
Kotlin语法笔记(28) -Kotlin 与 Java 混编
本系列教程详细讲解了Kotlin语法,适合需要深入了解Kotlin的开发者。对于希望快速学习Kotlin的用户,推荐查看“简洁”系列教程。本文档重点介绍了Kotlin与Java混编的技巧,包括代码转换、类调用、ProGuard问题、Android library开发建议以及在Kotlin和Java之间互相调用的方法。
104 1
|
5月前
|
安全 Java 编译器
Kotlin语法笔记(27) -Kotlin 与 Java 共存(二)
本教程详细讲解Kotlin语法,适合希望深入了解Kotlin的开发者。若需快速入门,建议查阅“简洁”系列教程。本文重点探讨Kotlin与Java共存的高级话题,包括属性访问、空安全、泛型处理、同步机制及SAM转换等,助你在项目中逐步引入Kotlin。
52 1
|
5月前
|
Java 程序员 编译器
在Java编程中,保留字(如class、int、for等)是具有特定语法意义的预定义词汇,被语言本身占用,不能用作变量名、方法名或类名。
在Java编程中,保留字(如class、int、for等)是具有特定语法意义的预定义词汇,被语言本身占用,不能用作变量名、方法名或类名。本文通过示例详细解析了保留字的定义、作用及与自定义标识符的区别,帮助开发者避免因误用保留字而导致的编译错误,确保代码的正确性和可读性。
111 3
|
5月前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML DOM 解析器

推荐镜像

更多