技术:Java-Web基础|XML解析(四)之JAXP-dom4j

简介: XML是标记型文档,js 使用 dom 解析标记型文档是根据 html 的层级结构,在内存中分配一个属性结构,把 html 的标签,属性和文本都封装成 document 对象、element 对象,属性对象、文本对象,node 节点对象。「XML」解析技术xml的解析技术:dom 和 sax。

1 XML介绍和解析方式


「XML解析介绍

XML是标记型文档,js 使用 dom 解析标记型文档是根据 html 的层级结构,在内存中分配一个属性结构,把 html 的标签,属性和文本都封装成 document 对象、element 对象,属性对象、文本对象,node 节点对象。


2 dom4j解析XML

2.1 dom4j概述

Dom4j是一个组织,针对xml解析,提供解析器,dom4j后来独立成一个公司,他的性能比jdom更加强大。


我们如果想要使用Dom4j,需要引入dom4j提供依赖接口。在Maven项目中,导入依赖包很简单、容易。


2.2 引入dom4j依赖

首先在maven依赖仓库找到dom4j的依赖,然后将他拷贝到我们的pom.xml中。

「查找依赖包」

image.png

「导入到pom文件」

pom.xml

    <dependencies>
        <!-- https://mvnrepository.com/artifact/org.dom4j/dom4j -->
        <dependency>
            <groupId>org.dom4j</groupId>
            <artifactId>dom4j</artifactId>
            <version>2.1.3</version>
        </dependency>
    </dependencies>


2.3 使用dom4j查询xml

首先创建persons.xml,我们还是使用上章节的文件。然后创建一个Dom4jParserXmlTest.java类。

「步骤」

1、创建解析器

2、获取Document对象

3、获取根元素

4、解析操作

    public static void main(String[] args) {
        String xmlPath = "./tool-jdk8/src/main/java/com/liuyc/tooljdk/xml/persons.xml";
        // 1、创建解析器
        SAXReader saxReader = SAXReader.createDefault();
        try {
            // 2、获取Document对象
            Document document = saxReader.read(new File(xmlPath));
            // 3、获取根元素
            Element rootElement = document.getRootElement();
            // 4、解析操作
            System.out.println("输出全部xml:" + rootElement.asXML());
        } catch (DocumentException e) {
            throw new RuntimeException(e);
        }
    }

执行操作之后,我们可看到如下信息:

<persons>
  <person sid="001" uid="QS#123">
    <name>张小帅</name>
    <sex>男</sex>
    <age>28</age>
  </person>
  <person sid="002">
    <name>刘晓萌</name>
    <sex>女</sex>
    <age>21</age>
  </person>
  <person sid="003">
    <name>王老四</name>
    <sex>男</sex>
    <age>38</age>
  </person>
</persons>


Dom4j的常用API说明:

方法 操作


Element getRootElement(); 获取XML文件的根节点


String getName(); 返回标签的名称


List < Element > elements(); 获取标签所有的子标签


String arrtributeVallue(String name) ; 获取指定属性名称的属性值


String getText(); 获取标签的文本


String elementText(String name); 获取指定名称的子标签的文本,返回子标签文本的值


2.4 新增元素

Elementsex1=p1. addElement("content");

注意⚠️:这个操作与之前所说的操作和方法不一样,之前用jip时需要先创建,但现在不需要创建,直接在下面添加元素。


2.5 新增元素的文本

sex1.setText("测试");


2.6 回写到xml

方法一

OutputFormatformat=outputFormat.createPrettyPrint();

注意⚠️:可以有缩进的效果。这个方法是静态的,直接用outputFormat.createPrettyPrint进行格式化。


「方法二」

OutputFormatformat=outputFormat.createCompactFormat();

这个方法有压缩的效果,一般运用在计算机里,企业用第一种方法。


XMLWriterxmlwriter=newXMLWriter(newFileoutputstream("src/p1.xml"),format);
xmlWriter.write(document);

把内存中的数写入到文件里去,括号里传入document,这样就把文档传入到xml文件里去。


xmlWriter.close();

关流,注意流一旦打开就要关闭


3 dom4j结合XPath解析XML

3.1 引入jaxen依赖

同样,依赖第三方jar时,我们需要引入依赖包。

image.png

<!--https://mvnrepository.com/artifact/jaxen/jaxen --><dependency><groupId>jaxen</groupId><artifactId>jaxen</artifactId><version>1.2.0</version></dependency>


3.2 使用XPath解析xml

Dom4j提供基于XPath的API

方法 操作


Node selectSingleNode(String xpathExpression); 根据XPath表达式获取单个标签(元素/节点)


List < Node > selectNodes(String xpathExpression) 根据XPath表达式获取多个标签(元素/节点)


「步骤」
1、获取解析器

2、获取Document对象

3、获取元素解析

publicstaticvoidmain(String[] args) {
StringxmlPath="./tool-jdk8/src/main/java/com/liuyc/tooljdk/xml/persons.xml";
SAXReadersaxReader=newSAXReader();
try {
Documentdocument=saxReader.read(newFile(xmlPath));
// 拿到第一个用户的姓名System.out.println("1.------>使用绝对路径方式来查找元素");
Elementelement= (Element) document.selectSingleNode("/persons/person/name");
StringnameEle=element.getText();
System.out.println(nameEle);
System.out.println("2.------>使用相对路径查找元素");
// element是当前获取的name元素Elementname= (Element) element.selectSingleNode("../name");
System.out.println("第一个用户的姓名为"+name.getText());
System.out.println("3.------>使用全局搜索的方式");
//获取所有的id元素的文本List<Node>idNodeList=document.selectNodes("//sid");
for (Nodenode : idNodeList) {
ElementidElement=(Element) node;
System.out.println(idElement.getText());
            }
System.out.println("4.------>谓语形式");
//获取id=10002的用户信息ElementidElement= (Element) document.selectSingleNode("//person[@sid='002']");
List<Element>elements=idElement.elements();
for (Elementelement1 : elements) {
System.out.println(element1.getName()+"="+element1.getText());
            }
        } catch (DocumentExceptione) {
e.printStackTrace();
        }
    }

「解析后的结果」

1.------>使用绝对路径方式来查找元素
张小帅
2.------>使用相对路径查找元素
第一个用户的姓名为张小帅
3.------>使用全局搜索的方式
4.------>谓语形式
name=刘晓萌
sex=女
age=21

相关文章
|
6月前
|
安全 Java API
Java Web 在线商城项目最新技术实操指南帮助开发者高效完成商城项目开发
本项目基于Spring Boot 3.2与Vue 3构建现代化在线商城,涵盖技术选型、核心功能实现、安全控制与容器化部署,助开发者掌握最新Java Web全栈开发实践。
663 1
|
传感器 人工智能 物联网
穿戴科技新风尚:智能服装设计与技术全解析
穿戴科技新风尚:智能服装设计与技术全解析
936 85
|
9月前
|
缓存 前端开发 应用服务中间件
Web端实时通信技术SSE在携程机票业务中的实践应用
本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。文章深入探讨了 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。该方案设计目标是实现通用性,适用于各种网络架构和业务场景。
309 1
|
10月前
|
缓存 前端开发 应用服务中间件
Web端实时通信技术SSE在携程机票业务中的实践应用
本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。文章深入探讨了 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
401 7
|
编解码 监控 网络协议
RTSP协议规范与SmartMediaKit播放器技术解析
RTSP协议是实时流媒体传输的重要规范,大牛直播SDK的rtsp播放器基于此构建,具备跨平台支持、超低延迟(100-300ms)、多实例播放、高效资源利用、音视频同步等优势。它广泛应用于安防监控、远程教学等领域,提供实时录像、快照等功能,优化网络传输与解码效率,并通过事件回调机制保障稳定性。作为高性能解决方案,它推动了实时流媒体技术的发展。
640 5
|
数据采集 机器学习/深度学习 存储
可穿戴设备如何重塑医疗健康:技术解析与应用实战
可穿戴设备如何重塑医疗健康:技术解析与应用实战
540 4
|
机器学习/深度学习 人工智能 自然语言处理
AI技术如何重塑客服系统?解析合力亿捷AI智能客服系统实践案例
本文探讨了人工智能技术在客服系统中的应用,涵盖技术架构、关键技术和优化策略。通过感知层、认知层、决策层和执行层的协同工作,结合自然语言处理、知识库构建和多模态交互技术,合力亿捷客服系统实现了智能化服务。文章还提出了用户体验优化、服务质量提升和系统性能改进的方法,并展望了未来发展方向,强调其在客户服务领域的核心价值与潜力。
766 6
|
监控 负载均衡 安全
静态IP代理与动态IP代理:提升速度与保障隐私的技术解析
本文探讨了静态IP代理和动态IP代理的特性和应用场景。静态IP代理通过高质量服务提供商、网络设置优化、定期更换IP与负载均衡及性能监控提升网络访问速度;动态IP代理则通过隐藏真实IP、增强安全性、绕过封锁和提供独立IP保障用户隐私。结合实际案例与代码示例,展示了两者在不同场景下的优势,帮助用户根据需求选择合适的代理服务以实现高效、安全的网络访问。
445 1
|
机器学习/深度学习 数据采集 自然语言处理
基于Python的情感分析与情绪识别技术深度解析
本文探讨了基于Python的情感分析与情绪识别技术,涵盖基础概念、实现方法及工业应用。文中区分了情感分析与情绪识别的核心差异,阐述了从词典法到深度学习的技术演进,并通过具体代码展示了Transformers架构在细粒度情感分析中的应用,以及多模态情绪识别框架的设计。此外,还介绍了电商评论分析系统的构建与优化策略,包括领域自适应训练和集成学习等方法。未来,随着深度学习和多模态数据的发展,该技术将更加智能与精准。
764 1

热门文章

最新文章

推荐镜像

更多
  • DNS