Java Web之JSP操作XML(XML的文档结构 语法和注释、dom4j的下载与配置 应用dom4j创建、解析和修改XML)

简介: Java Web之JSP操作XML(XML的文档结构 语法和注释、dom4j的下载与配置 应用dom4j创建、解析和修改XML)

前言


XML是eXtensible Markup Language(可扩展标记语言)的缩写,是SGML(标准通用化标记语言)的一个子集 用于提供数据描述格式 适用于不同应用程序间的数据交换,而且这种交换不以预先定义的一组数据结构作为前提,增强了可扩展性。


一、XML文档结构

1666443388413.jpg

一个基本的XML文档通常由序言和文档元素两部分组成


1:序言


可以包括XML声明 处理指令和注释 XML文档的第一行通常是XML声明 语法如下

<? xml version="version" encoding="value" standalone="value"?>


standalone 用于指定XML文档是否和另一个外部文档嵌套使用  yes则为一个独立的文档


2:文档元素


XML文档中的元素是以树形分层结构排列的 一个元素可以嵌套在另一个元素中,XML文档中有且只有一个顶层元素 称为文档元素或根元素

<tagname>content</tagname>


XML语法要求


1:XML文档必须有一个顶层元素 其他元素必须嵌入在顶层元素中


2:元素嵌套要正确 不能重叠或者跨越


3:每一个元素必须同时拥有起始标记和结束标记


4:元素类型名要完全匹配


5:XML元素类型名区分大小写


6:元素类型名称不可以以 -开头 也不可以包含空格和:


7:元素可以包含属性 但属性值必须用单引号或者双引号括起来


为XML文档中 的元素定义属性

<info id="1">


XML的注释


注释以<!--开始  以字符串-->结束


处理字符数据


在XML文档中 有些字符会被XML解析器当作标记进行处理 如果希望把这些字符作为普通字符处理,就需要使用实体引用或CDATA段


< 实体引用为&1t  >实体引用为&gt &实体引用为&amp '实体引用为&apos "实体引用为&quot

<?xml version="1.0" encoding="GBK"?>
<placard version="2.0">
<info id="1">
 <title>重要通知</title>
 <content>&amp;nbsp;&amp;nbsp;明天下午三点</content>
 <pubDate>2022-10-17</pubDate>
</info>
</placard>


使用CDATA段


CDATA段是一种用来包含文本的方法 其内部的所有内容都会被XML解析器当作普通文本  所以任何符号都不会被认为是标识符 语法如下

<![CDATA[文本内容]]>


二、dom4j简介


dom4j是sourceforge.net上的一个Java开源项目 主要用于操作XML文档 如 创建XML文档和解析XML文档 dom4j应用于Java平台 采用了Java集合框架并完全支持DOM SAX JAXP是一种适合Java程序员使用的Java XML解析器


dom4j的下载与配置


1:进入网址dom4j


2:点击Download下载最新版本的dom4j


3:将文件解压后  将dom4j.1.6.1.jar文件和lib文件夹下的jaxen-1.1-beta-6.jar文件配置到构建路径下中  或者将这两个文件直接复制到项目的lib文件夹中


三、创建XML文档


dom4j组件的一个最重要的功能就是创建XML文档 通过该组件可以很方便的创建XML文档


1:创建XML文档对象


代码如下

Document document=DocumentHelper.createDocument();


2:创建根节点


为XML文档创建根节点 首先需要创建一个普通节点  然后调用方法将该节点设置为根节点


创建一个普通节点语法如下

public static Element createElement(String name)


设置为根节点

public void setRootElement(Element rootElement)


3:添加注释

public Element addComment(String comment)
 placard.addComment("芝士根节点");


4:添加属性

public Element addAttribute(String name,String value)


5:设置节点的内容

public void setText(String text)


6:设置编码

public void setEncoding(String encoding)


7:设置输出格式

public static OutputFormat createPrettyPrint()


输出XML文档


1:未设置输出格式

XMLWriter writer=new XMLWriter(new FileWriter(fileURL));
writer.write(document);
writer.close();


2:已经设置了输出格式或编码集

XMLWriter writer=new XMLWriter(new FileWriter(fileURL),format);
writer.write(document);
writer.close();


四、解析XML文档


构建XML文档对象

SAXReader reader=new SAXReader();
Document document=reader.read(new File(fileURL));


获取根节点

Element placard=document.getRootElement();


获取子节点


1:element方法

用于获取指定名称的第一个节点

public Element element(String name)


2:elements方法

用于获取指定名称的全部节点

public List elements(String name)


五、修改XML文档


1:修改节点


在修改XML文档的节点前 首先需要查询到该节点


查询符合条件的唯一节点

public Node selectSingleNode(String xpathExpression)


查询符合指定条件的节点列表

public List selectNodes(String xpathExpression)


获取到要修改的节点后 就可以应用前面的方法对该节点进行修改操作


2:删除节点


同理首先查询你要删除的节点 方法同上


然后用remove方法删除该节点

public boolean remove(Element element)

1666443769043.jpg

1666443780311.jpg

相关文章
|
8月前
|
人工智能 前端开发 Java
2025年WebStorm高效Java开发全指南:从配置到实战
WebStorm 2025不仅是一款强大的JavaScript IDE,也全面支持Java开发。本文详解其AI辅助编程、Java特性增强及性能优化,并提供环境配置、高效开发技巧与实战案例,助你打造流畅的全栈开发体验。
658 4
|
9月前
|
Java 应用服务中间件 Linux
在Java 12环境中配置和部署Apache Tomcat的步骤。
这段部署Tomcat的冒险旅程充满技术挑战,但同时也像游戏一样充满乐趣。它需要你提前准备,仔细执行,并随时准备解决意外情况。成功后,你就可以在这匹强壮的网络野马上,带着你的Java应用,冲向Web开发的璀璨星空。
260 56
|
8月前
|
存储 搜索推荐 算法
Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用(195)
本文深入探讨了Java大数据技术在智能金融理财产品风险评估与个性化配置中的关键应用。通过高效的数据采集、存储与分析,Java大数据技术助力金融机构实现精准风险评估与个性化推荐,提升投资收益并降低风险。
Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用(195)
|
10月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
358 13
用深度学习提升DOM解析——自动提取页面关键区块
|
12月前
|
存储 设计模式 Java
重学Java基础篇—ThreadLocal深度解析与最佳实践
ThreadLocal 是一种实现线程隔离的机制,为每个线程创建独立变量副本,适用于数据库连接管理、用户会话信息存储等场景。
429 5
|
12月前
|
存储 监控 安全
重学Java基础篇—类的生命周期深度解析
本文全面解析了Java类的生命周期,涵盖加载、验证、准备、解析、初始化、使用及卸载七个关键阶段。通过分阶段执行机制详解(如加载阶段的触发条件与技术实现),结合方法调用机制、内存回收保护等使用阶段特性,以及卸载条件和特殊场景处理,帮助开发者深入理解JVM运作原理。同时,文章探讨了性能优化建议、典型异常处理及新一代JVM特性(如元空间与模块化系统)。总结中强调安全优先、延迟加载与动态扩展的设计思想,并提供开发建议与进阶方向,助力解决性能调优、内存泄漏排查及框架设计等问题。
507 5
|
12月前
|
Java Shell 数据库
【YashanDB知识库】调用外部UDF未能识别Java环境配置
【YashanDB知识库】调用外部UDF未能识别Java环境配置
【YashanDB知识库】调用外部UDF未能识别Java环境配置
|
12月前
|
机器学习/深度学习 人工智能 Java
Java机器学习实战:基于DJL框架的手写数字识别全解析
在人工智能蓬勃发展的今天,Python凭借丰富的生态库(如TensorFlow、PyTorch)成为AI开发的首选语言。但Java作为企业级应用的基石,其在生产环境部署、性能优化和工程化方面的优势不容忽视。DJL(Deep Java Library)的出现完美填补了Java在深度学习领域的空白,它提供了一套统一的API,允许开发者无缝对接主流深度学习框架,将AI模型高效部署到Java生态中。本文将通过手写数字识别的完整流程,深入解析DJL框架的核心机制与应用实践。
735 3
|
11月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
291 0

推荐镜像

更多
  • DNS