【JavaSE】Java基础语法(四十四):XML解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 1. 概述万维网联盟(W3C)万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

1. 概述

  • 万维网联盟(W3C)
    万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。

是Web技术领域最具权威和影响力的国际中立性技术标准机构。

到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,

- 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)

- 可扩展标记语言XML(标准通用标记语言下的一个子集)

- 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等


xml概述

XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言

标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)

可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的


作用

- 用于进行存储数据和传输数据

- 作为软件的配置文件


作为配置文件的优势

- 可读性好

- 可维护性高

2.标签的规则

  • 标签由一对尖括号和合法标识符组成
<student>
• 1
  • 标签必须成对出现
<student> </student>
前边的是开始标签,后边的是结束标签
• 1
• 2

标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来

<student id="1"> </student>

标签需要正确的嵌套

这是正确的: <student id="1"> <name>张三</name> </student>
这是错误的: <student id="1"><name>张三</student></name>


3. 语法规则【应用】

  • 语法规则
  • XML文件的后缀名为:xml

文档声明必须是第一行第一列

version:该属性是必须存在的

encoding:该属性不是必须的

打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

必须存在一个根标签,有且只能有一个

  • XML文件中可以定义注释信息
  • XML文件中可以存在以下特殊字符
&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号
  • XML文件中可以存在CDATA区
  • 示例代码
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息
</info>
<message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>

4. xml解析【应用】

  • 概述
    xml解析就是从xml中获取到数据
  • 常见的解析思想
    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。
    会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

bad9d5c85264483f8aea700204704e4b.png

常见的解析工具

JAXP: SUN公司提供的一套XML的解析的API

JDOM: 开源组织提供了一套XML的解析的API-jdom

DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java

pull: 主要应用在Android手机端解析XML

解析的准备工作


我们可以通过网站:https://dom4j.github.io/ 去下载dom4j

今天的资料中已经提供,我们不用再单独下载了,直接使用即可

将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar

在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中

选中jar包 -> 右键 -> 选择add as library即可

  • 需求
    - 解析提供好的xml文件
    - 将解析到的数据封装到学生对象中
    - 并将学生对象存储到ArrayList集合中
    - 遍历集合
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
  <!--第一个学生信息-->
  <student id="1">
    <name>张三</name>
    <age>23</age>
  </student>
  <!--第二个学生信息-->
  <student id="2">
    <name>李四</name>
    <age>24</age>
  </student>
</students>
public class Student {
  private String id;
  private String name;
  private int age;
  public Student() {
  }
  public Student(String id, String name, int age) {
    this.id = id;
    this.name = name;
    this.age = age;
  }
  public String getId() {
    return id;
  }
  public void setId(String id) {
    this.id = id;
  }
  public String getName() {
    return name;
  }
  public void setName(String name) {
    this.name = name;
  }
  public int getAge() {
    return age;
  }
  public void setAge(int age) {
    this.age = age;
  }
  @Override
  public String toString() {
    return "Student{" +
    "id='" + id + '\'' +
    ", name='" + name + '\'' +
    ", age=" + age +
    '}';
  }
}
/**
* 利用dom4j解析xml文件
*/
public class XmlParse {
  public static void main(String[] args) throws DocumentException {
    //1.获取一个解析器对象
    SAXReader saxReader = new SAXReader();
    //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
    Document document = saxReader.read(new
    File("myxml\\xml\\student.xml"));
    //3.获取到根标签
    Element rootElement = document.getRootElement();
    //4.通过根标签来获取student标签
    //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
    //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集
    合中并返回
    //List list = rootElement.elements();
    List<Element> studentElements = rootElement.elements("student");
    //System.out.println(list.size());
    //用来装学生对象
    ArrayList<Student> list = new ArrayList<>();
    //5.遍历集合,得到每一个student标签
    for (Element element : studentElements) {
      //element依次表示每一个student标签
      //获取id这个属性
      Attribute attribute = element.attribute("id");
      //获取id的属性值
      String id = attribute.getValue();
      //获取name标签
      //element("标签名"):获取调用者指定的子标签
      Element nameElement = element.element("name");
      //获取这个标签的标签体内容
      String name = nameElement.getText();
      //获取age标签
      Element ageElement = element.element("age");
      //获取age标签的标签体内容
      String age = ageElement.getText();
      // System.out.println(id);
      // System.out.println(name);
      // System.out.println(age);
      Student s = new Student(id,name,Integer.parseInt(age));
      list.add(s);
    }
    //遍历操作
    for (Student student : list) {
      System.out.println(student);
    }
  }
}

相关文章
|
24天前
|
存储 缓存 安全
Java内存模型深度解析:从理论到实践####
【10月更文挑战第21天】 本文深入探讨了Java内存模型(JMM)的核心概念与底层机制,通过剖析其设计原理、内存可见性问题及其解决方案,结合具体代码示例,帮助读者构建对JMM的全面理解。不同于传统的摘要概述,我们将直接以故事化手法引入,让读者在轻松的情境中领略JMM的精髓。 ####
33 6
|
26天前
|
监控 算法 Java
Java虚拟机(JVM)的垃圾回收机制深度解析####
本文深入探讨了Java虚拟机(JVM)的垃圾回收机制,旨在揭示其背后的工作原理与优化策略。我们将从垃圾回收的基本概念入手,逐步剖析标记-清除、复制算法、标记-整理等主流垃圾回收算法的原理与实现细节。通过对比不同算法的优缺点及适用场景,为开发者提供优化Java应用性能与内存管理的实践指南。 ####
|
20天前
|
Java 编译器
Java 泛型详细解析
本文将带你详细解析 Java 泛型,了解泛型的原理、常见的使用方法以及泛型的局限性,让你对泛型有更深入的了解。
30 2
Java 泛型详细解析
|
20天前
|
缓存 监控 Java
Java线程池提交任务流程底层源码与源码解析
【11月更文挑战第30天】嘿,各位技术爱好者们,今天咱们来聊聊Java线程池提交任务的底层源码与源码解析。作为一个资深的Java开发者,我相信你一定对线程池并不陌生。线程池作为并发编程中的一大利器,其重要性不言而喻。今天,我将以对话的方式,带你一步步深入线程池的奥秘,从概述到功能点,再到背景和业务点,最后到底层原理和示例,让你对线程池有一个全新的认识。
50 12
|
17天前
|
存储 算法 Java
Java内存管理深度解析####
本文深入探讨了Java虚拟机(JVM)中的内存分配与垃圾回收机制,揭示了其高效管理内存的奥秘。文章首先概述了JVM内存模型,随后详细阐述了堆、栈、方法区等关键区域的作用及管理策略。在垃圾回收部分,重点介绍了标记-清除、复制算法、标记-整理等多种回收算法的工作原理及其适用场景,并通过实际案例分析了不同GC策略对应用性能的影响。对于开发者而言,理解这些原理有助于编写出更加高效、稳定的Java应用程序。 ####
|
17天前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
19天前
|
Java 数据库连接 开发者
Java中的异常处理机制:深入解析与最佳实践####
本文旨在为Java开发者提供一份关于异常处理机制的全面指南,从基础概念到高级技巧,涵盖try-catch结构、自定义异常、异常链分析以及最佳实践策略。不同于传统的摘要概述,本文将以一个实际项目案例为线索,逐步揭示如何高效地管理运行时错误,提升代码的健壮性和可维护性。通过对比常见误区与优化方案,读者将获得编写更加健壮Java应用程序的实用知识。 --- ####
|
23天前
|
数据采集 存储 Web App开发
Java爬虫:深入解析商品详情的利器
在数字化时代,信息处理能力成为企业竞争的关键。本文探讨如何利用Java编写高效、准确的商品详情爬虫,涵盖爬虫技术概述、Java爬虫优势、开发步骤、法律法规遵守及数据处理分析等内容,助力电商领域市场趋势把握与决策支持。
|
24天前
|
安全 Java
Java中WAIT和NOTIFY方法调用时机的深层解析
在Java多线程编程中,`wait()`和`notify()`方法的正确使用对于线程间的协调至关重要。这两个方法必须在同步块或同步方法中调用,这一规定的深层原因是什么呢?本文将深入探讨这一机制。
34 5
|
22天前
|
存储 缓存 监控
Java中的线程池深度解析####
本文深入探讨了Java并发编程中的核心组件——线程池,从其基本概念、工作原理、核心参数解析到应用场景与最佳实践,全方位剖析了线程池在提升应用性能、资源管理和任务调度方面的重要作用。通过实例演示和性能对比,揭示合理配置线程池对于构建高效Java应用的关键意义。 ####

推荐镜像

更多
下一篇
DataWorks