【JavaSE】Java基础语法(四十四):XML解析

简介: 1. 概述万维网联盟(W3C)万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

1. 概述

  • 万维网联盟(W3C)
    万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。

建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。

是Web技术领域最具权威和影响力的国际中立性技术标准机构。

到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,

- 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)

- 可扩展标记语言XML(标准通用标记语言下的一个子集)

- 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等


xml概述

XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言

标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)

可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的


作用

- 用于进行存储数据和传输数据

- 作为软件的配置文件


作为配置文件的优势

- 可读性好

- 可维护性高

2.标签的规则

  • 标签由一对尖括号和合法标识符组成
<student>
• 1
  • 标签必须成对出现
<student> </student>
前边的是开始标签,后边的是结束标签
• 1
• 2

标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来

<student id="1"> </student>

标签需要正确的嵌套

这是正确的: <student id="1"> <name>张三</name> </student>
这是错误的: <student id="1"><name>张三</student></name>


3. 语法规则【应用】

  • 语法规则
  • XML文件的后缀名为:xml

文档声明必须是第一行第一列

version:该属性是必须存在的

encoding:该属性不是必须的

打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

必须存在一个根标签,有且只能有一个

  • XML文件中可以定义注释信息
  • XML文件中可以存在以下特殊字符
&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号
  • XML文件中可以存在CDATA区
  • 示例代码
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息
</info>
<message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>

4. xml解析【应用】

  • 概述
    xml解析就是从xml中获取到数据
  • 常见的解析思想
    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。
    会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

bad9d5c85264483f8aea700204704e4b.png

常见的解析工具

JAXP: SUN公司提供的一套XML的解析的API

JDOM: 开源组织提供了一套XML的解析的API-jdom

DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java

pull: 主要应用在Android手机端解析XML

解析的准备工作


我们可以通过网站:https://dom4j.github.io/ 去下载dom4j

今天的资料中已经提供,我们不用再单独下载了,直接使用即可

将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar

在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中

选中jar包 -> 右键 -> 选择add as library即可

  • 需求
    - 解析提供好的xml文件
    - 将解析到的数据封装到学生对象中
    - 并将学生对象存储到ArrayList集合中
    - 遍历集合
  • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
  <!--第一个学生信息-->
  <student id="1">
    <name>张三</name>
    <age>23</age>
  </student>
  <!--第二个学生信息-->
  <student id="2">
    <name>李四</name>
    <age>24</age>
  </student>
</students>
public class Student {
  private String id;
  private String name;
  private int age;
  public Student() {
  }
  public Student(String id, String name, int age) {
    this.id = id;
    this.name = name;
    this.age = age;
  }
  public String getId() {
    return id;
  }
  public void setId(String id) {
    this.id = id;
  }
  public String getName() {
    return name;
  }
  public void setName(String name) {
    this.name = name;
  }
  public int getAge() {
    return age;
  }
  public void setAge(int age) {
    this.age = age;
  }
  @Override
  public String toString() {
    return "Student{" +
    "id='" + id + '\'' +
    ", name='" + name + '\'' +
    ", age=" + age +
    '}';
  }
}
/**
* 利用dom4j解析xml文件
*/
public class XmlParse {
  public static void main(String[] args) throws DocumentException {
    //1.获取一个解析器对象
    SAXReader saxReader = new SAXReader();
    //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
    Document document = saxReader.read(new
    File("myxml\\xml\\student.xml"));
    //3.获取到根标签
    Element rootElement = document.getRootElement();
    //4.通过根标签来获取student标签
    //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
    //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集
    合中并返回
    //List list = rootElement.elements();
    List<Element> studentElements = rootElement.elements("student");
    //System.out.println(list.size());
    //用来装学生对象
    ArrayList<Student> list = new ArrayList<>();
    //5.遍历集合,得到每一个student标签
    for (Element element : studentElements) {
      //element依次表示每一个student标签
      //获取id这个属性
      Attribute attribute = element.attribute("id");
      //获取id的属性值
      String id = attribute.getValue();
      //获取name标签
      //element("标签名"):获取调用者指定的子标签
      Element nameElement = element.element("name");
      //获取这个标签的标签体内容
      String name = nameElement.getText();
      //获取age标签
      Element ageElement = element.element("age");
      //获取age标签的标签体内容
      String age = ageElement.getText();
      // System.out.println(id);
      // System.out.println(name);
      // System.out.println(age);
      Student s = new Student(id,name,Integer.parseInt(age));
      list.add(s);
    }
    //遍历操作
    for (Student student : list) {
      System.out.println(student);
    }
  }
}

相关文章
|
1天前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML解析器是浏览器内置的工具,用于将XML转换为JavaScript可操作的XML DOM对象。这个DOM包含遍历、修改XML节点的函数。首先,XML文档需加载到DOM中,通过XMLHttpRequest对象实现,如示例所示:根据浏览器类型创建XMLHTTP对象,打开并发送GET请求到服务器获取&quot;books.xml&quot;,然后将响应转化为DOM对象。
|
1天前
|
Java 程序员 API
Java 8新特性之Lambda表达式与Stream API的深度解析
【5月更文挑战第12天】本文将深入探讨Java 8中的两个重要新特性:Lambda表达式和Stream API。我们将从基本概念入手,逐步深入到实际应用场景,帮助读者更好地理解和掌握这两个新特性,提高Java编程效率。
14 2
|
2天前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML解析器是浏览器内置的工具,用于将XML转换为JavaScript可操作的XML DOM对象。通过DOM,可以进行节点的遍历、访问和修改。以下JS代码示例展示了如何加载XML文档&quot;books.xml&quot;:首先检查XMLHttpRequest支持,然后创建请求对象,打开并发送GET请求,最后将响应转化为DOM对象。
|
3天前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML解析器是浏览器内置工具,用于将XML转换为JavaScript可操作的XML DOM对象,允许遍历、修改节点。大多数现代浏览器支持这一功能。以下JS代码示例展示了如何加载XML文档&quot;books.xml&quot;
|
3天前
|
XML JavaScript Java
详解Java解析XML的四种方法
详解Java解析XML的四种方法
|
4天前
|
Java
解析java中的数组
解析java中的数组
11 3
|
5天前
|
存储 Java 程序员
Java面向对象编程的基础概念解析
Java面向对象编程的基础概念解析
13 0
|
6天前
|
分布式计算 Java API
Java8 Lambda实现源码解析
Java8的lambda应该大家都比较熟悉了,本文主要从源码层面探讨一下lambda的设计和实现。
14741 4
|
11天前
|
安全 前端开发 Java
10:基于Servlet模拟用户登录功能的实现与解析-Java Web
10:基于Servlet模拟用户登录功能的实现与解析-Java Web
24 3
|
21天前
|
XML 数据格式
小米备份descript.xml文件
小米备份descript.xml文件
21 0

推荐镜像

更多