技术:Java-Web基础|XML解析(四)之JAXP-dom4j

简介: XML是标记型文档,js 使用 dom 解析标记型文档是根据 html 的层级结构,在内存中分配一个属性结构,把 html 的标签,属性和文本都封装成 document 对象、element 对象,属性对象、文本对象,node 节点对象。「XML」解析技术xml的解析技术:dom 和 sax。

1 XML介绍和解析方式


「XML解析介绍

XML是标记型文档,js 使用 dom 解析标记型文档是根据 html 的层级结构,在内存中分配一个属性结构,把 html 的标签,属性和文本都封装成 document 对象、element 对象,属性对象、文本对象,node 节点对象。


2 dom4j解析XML

2.1 dom4j概述

Dom4j是一个组织,针对xml解析,提供解析器,dom4j后来独立成一个公司,他的性能比jdom更加强大。


我们如果想要使用Dom4j,需要引入dom4j提供依赖接口。在Maven项目中,导入依赖包很简单、容易。


2.2 引入dom4j依赖

首先在maven依赖仓库找到dom4j的依赖,然后将他拷贝到我们的pom.xml中。

「查找依赖包」

image.png

「导入到pom文件」

pom.xml

    <dependencies>
        <!-- https://mvnrepository.com/artifact/org.dom4j/dom4j -->
        <dependency>
            <groupId>org.dom4j</groupId>
            <artifactId>dom4j</artifactId>
            <version>2.1.3</version>
        </dependency>
    </dependencies>


2.3 使用dom4j查询xml

首先创建persons.xml,我们还是使用上章节的文件。然后创建一个Dom4jParserXmlTest.java类。

「步骤」

1、创建解析器

2、获取Document对象

3、获取根元素

4、解析操作

    public static void main(String[] args) {
        String xmlPath = "./tool-jdk8/src/main/java/com/liuyc/tooljdk/xml/persons.xml";
        // 1、创建解析器
        SAXReader saxReader = SAXReader.createDefault();
        try {
            // 2、获取Document对象
            Document document = saxReader.read(new File(xmlPath));
            // 3、获取根元素
            Element rootElement = document.getRootElement();
            // 4、解析操作
            System.out.println("输出全部xml:" + rootElement.asXML());
        } catch (DocumentException e) {
            throw new RuntimeException(e);
        }
    }

执行操作之后,我们可看到如下信息:

<persons>
  <person sid="001" uid="QS#123">
    <name>张小帅</name>
    <sex>男</sex>
    <age>28</age>
  </person>
  <person sid="002">
    <name>刘晓萌</name>
    <sex>女</sex>
    <age>21</age>
  </person>
  <person sid="003">
    <name>王老四</name>
    <sex>男</sex>
    <age>38</age>
  </person>
</persons>


Dom4j的常用API说明:

方法 操作


Element getRootElement(); 获取XML文件的根节点


String getName(); 返回标签的名称


List < Element > elements(); 获取标签所有的子标签


String arrtributeVallue(String name) ; 获取指定属性名称的属性值


String getText(); 获取标签的文本


String elementText(String name); 获取指定名称的子标签的文本,返回子标签文本的值


2.4 新增元素

Elementsex1=p1. addElement("content");

注意⚠️:这个操作与之前所说的操作和方法不一样,之前用jip时需要先创建,但现在不需要创建,直接在下面添加元素。


2.5 新增元素的文本

sex1.setText("测试");


2.6 回写到xml

方法一

OutputFormatformat=outputFormat.createPrettyPrint();

注意⚠️:可以有缩进的效果。这个方法是静态的,直接用outputFormat.createPrettyPrint进行格式化。


「方法二」

OutputFormatformat=outputFormat.createCompactFormat();

这个方法有压缩的效果,一般运用在计算机里,企业用第一种方法。


XMLWriterxmlwriter=newXMLWriter(newFileoutputstream("src/p1.xml"),format);
xmlWriter.write(document);

把内存中的数写入到文件里去,括号里传入document,这样就把文档传入到xml文件里去。


xmlWriter.close();

关流,注意流一旦打开就要关闭


3 dom4j结合XPath解析XML

3.1 引入jaxen依赖

同样,依赖第三方jar时,我们需要引入依赖包。

image.png

<!--https://mvnrepository.com/artifact/jaxen/jaxen --><dependency><groupId>jaxen</groupId><artifactId>jaxen</artifactId><version>1.2.0</version></dependency>


3.2 使用XPath解析xml

Dom4j提供基于XPath的API

方法 操作


Node selectSingleNode(String xpathExpression); 根据XPath表达式获取单个标签(元素/节点)


List < Node > selectNodes(String xpathExpression) 根据XPath表达式获取多个标签(元素/节点)


「步骤」
1、获取解析器

2、获取Document对象

3、获取元素解析

publicstaticvoidmain(String[] args) {
StringxmlPath="./tool-jdk8/src/main/java/com/liuyc/tooljdk/xml/persons.xml";
SAXReadersaxReader=newSAXReader();
try {
Documentdocument=saxReader.read(newFile(xmlPath));
// 拿到第一个用户的姓名System.out.println("1.------>使用绝对路径方式来查找元素");
Elementelement= (Element) document.selectSingleNode("/persons/person/name");
StringnameEle=element.getText();
System.out.println(nameEle);
System.out.println("2.------>使用相对路径查找元素");
// element是当前获取的name元素Elementname= (Element) element.selectSingleNode("../name");
System.out.println("第一个用户的姓名为"+name.getText());
System.out.println("3.------>使用全局搜索的方式");
//获取所有的id元素的文本List<Node>idNodeList=document.selectNodes("//sid");
for (Nodenode : idNodeList) {
ElementidElement=(Element) node;
System.out.println(idElement.getText());
            }
System.out.println("4.------>谓语形式");
//获取id=10002的用户信息ElementidElement= (Element) document.selectSingleNode("//person[@sid='002']");
List<Element>elements=idElement.elements();
for (Elementelement1 : elements) {
System.out.println(element1.getName()+"="+element1.getText());
            }
        } catch (DocumentExceptione) {
e.printStackTrace();
        }
    }

「解析后的结果」

1.------>使用绝对路径方式来查找元素
张小帅
2.------>使用相对路径查找元素
第一个用户的姓名为张小帅
3.------>使用全局搜索的方式
4.------>谓语形式
name=刘晓萌
sex=女
age=21

相关文章
|
3天前
|
XML JavaScript 数据格式
XML DOM 浏览器差异
不同浏览器对XML DOM解析处理存在差异,尤其是在处理空白和换行方面。当XML文档中包含换行和空格时,Internet Explorer不会将这些视为文本节点,而其他浏览器则会。例如,一个简单的XML文档在各子节点间有空格和换行,IE会识别为4个子节点,而其他浏览器则识别为9个。示例代码通过加载XML文件并输出子节点数量来展示这一差异。
|
5天前
|
XML JavaScript 数据格式
XML DOM 节点列表
`getElementsByTagName()` 和 `childNodes` 返回 XML DOM 中的节点列表,表现为按顺序排列的节点集合。节点通过 0 开始的索引访问。例如,以下代码加载 &quot;books.xml&quot;,获取所有 `&lt;title&gt;` 元素的节点列表,然后提取第一个 `&lt;title&gt;` 的文本内容:`xmlDoc.getElementsByTagName(&quot;title&quot;)[0].childNodes[0].nodeValue`,结果为 &quot;Everyday Italian&quot;。
|
7天前
|
XML JavaScript 前端开发
XML DOM 节点信息
XML DOM 节点详解:nodeName、nodeValue 和 nodeType 属性用于获取和操作节点信息。示例展示如何加载XML文件,如books.xml,通过loadXMLDoc函数。nodeName获取元素节点名,nodeValue用于获取或设置文本节点内容,nodeType显示节点类型(如元素:1,属性:2,文本:3,注释:8,文档:9)。每个节点都是可访问和操作的对象,包含方法和属性。
|
1天前
|
XML JavaScript 数据格式
Beautiful Soup 库的工作原理基于解析器和 DOM(文档对象模型)树的概念
Beautiful Soup 使用解析器(如 html.parser, lxml, html5lib)解析HTML/XML文档,构建DOM树。它提供方法查询和操作DOM,如find(), find_all()查找元素,get_text(), get()提取信息。还能修改DOM,添加、修改或删除元素,并通过prettify()输出格式化字符串。它是处理网页数据的利器,尤其在处理不规则结构时。
6 2
|
1天前
|
XML Web App开发 JavaScript
XML DOM 解析器
XML解析器是浏览器内置工具,用于将XML转换为JavaScript可操作的XML DOM对象,允许遍历、修改节点。大多数现代浏览器支持这一功能。以下JS代码示例展示了如何加载XML文档&quot;books.xml&quot;
|
2天前
|
XML JavaScript 前端开发
XML DOM 节点信息
XML DOM提供nodeName、nodeValue和nodeType属性来揭示节点详情。一个JavaScript示例展示了如何运用这些属性:loadXMLDoc函数加载XML文件&quot;books.xml&quot;,然后通过nodeName获取根元素名,用nodeValue提取文本节点的内容。
|
3天前
|
XML Web App开发 JavaScript
XML DOM - 导航节点
在XML DOM中,导航节点涉及利用parentNode、childNodes、firstChild、lastChild、nextSibling和previousSibling属性来遍历节点树。不同浏览器对空文本节点处理不一致,可能导致导航问题。为解决此问题,可以使用get_nextSibling函数,它检查并跳过非元素类型的空文本节点,确保在IE和Firefox等浏览器中得到一致的结果。该函数循环遍历直到找到下一个元素节点。
|
3天前
|
前端开发 搜索推荐 安全
AJAX和CSR(客户端渲染)是Web开发中常用的两种技术
【5月更文挑战第8天】AJAX提升用户体验,减轻服务器压力,但对搜索引擎不友好且增加开发复杂度,易引发安全问题。CSR提供快速响应和交互性,改善用户体验,但首屏加载慢,搜索引擎支持不足,同样面临安全挑战。两者各有适用场景,需按项目需求选择。
9 0
|
4天前
|
XML JavaScript 前端开发
XML DOM 遍历节点树
该示例展示了如何遍历XML文档的节点树。通过DOMParser解析XML字符串得到xmlDoc,然后遍历根节点的子节点,显示每个节点的名称及其文本值。输出结果为:&quot;title: Everyday Italian&quot;, &quot;author: Giada De Laurentiis&quot;, &quot;year: 2005&quot;。代码使用JavaScript实现,循环遍历并更新HTML元素`&lt;p id=&quot;demo&quot;&gt;&lt;/p&gt;`的内容。
|
7天前
|
XML JavaScript 前端开发
XML DOM 节点信息
XML DOM中的每个节点都是一个具有方法和属性的对象,可通过JavaScript操作。关键属性有:nodeName(定义节点名称,如元素、属性或#text)、nodeValue(提供节点值,如文本或属性值)和nodeType。元素节点的nodeName等于标签名,属性节点的nodeName是属性名。文本节点的nodeValue是其文本内容,而文档节点的nodeName是&quot;#document&quot;。示例代码演示了如何获取第一个&lt;title&gt;元素的文本值。