Java眼中的XML--文件读取--1 应用DOM方式解析XML

简介:

初次邂逅XML:

需要解析的XML文件:

这里有两个book子节点。

1、如何进行XML文件解析前的准备工作,另外解析先获取book节点。

这个我后来看懂了:

这个Node的ELEMENT_NODE=1和上面是一样的。

2、使用DOM解析XML文件的属性名和属性值(分两种情况)

第一种,当属性个数是1~N个的时候:

复制代码
 1 public class DOMTest {
 2  3 public static void main(String[] args) {
 4 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
 5 try {
 6 DocumentBuilder db = dbf.newDocumentBuilder();
 7 Document d = db.parse("books.xml");
 8 //1、根据节点名book,获取节点集合  9 NodeList nodelist = d.getElementsByTagName("book");
10 //2、遍历集合中所有的元素(节点) 11 for (int i = 0; i < nodelist.getLength(); i++) {
12 Node node = nodelist.item(i);
13 //3、获取每个节点的属性集合,并输出属性的个数 14 NamedNodeMap attrMap = node.getAttributes();
15 System.out.println("属性的个数是:"+attrMap.getLength());
16 //4、遍历所有属性,并输出属性值 17 for (int j = 0; j < attrMap.getLength(); j++) {
18 Node attr = attrMap.item(j);
19 System.out.println(attr.getNodeName()+":"+attr.getNodeValue());
20  }
21  }
22 } catch (ParserConfigurationException e) {
23 // TODO Auto-generated catch block 24  e.printStackTrace();
25 } catch (SAXException e) {
26 // TODO Auto-generated catch block 27  e.printStackTrace();
28 } catch (IOException e) {
29 // TODO Auto-generated catch block 30  e.printStackTrace();
31  }
32  }
33 }
复制代码

第二种,当节点属性值只有一个的时候,可以这样:

复制代码
 1 public class DOMTest {
 2  3 public static void main(String[] args) {
 4 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
 5 try {
 6 DocumentBuilder db = dbf.newDocumentBuilder();
 7 Document d = db.parse("books.xml");
 8 //1、根据节点名book,获取节点集合  9 NodeList nodelist = d.getElementsByTagName("book");
10 //2、遍历集合中所有的元素(节点),并强制转换为element 11 for (int i = 0; i < nodelist.getLength(); i++) {
12 Element node = (Element) nodelist.item(i);
13 String str = node.getAttribute("id");
14  System.out.println(str);
15  }
16 } catch (ParserConfigurationException e) {
17 // TODO Auto-generated catch block 18  e.printStackTrace();
19 } catch (SAXException e) {
20 // TODO Auto-generated catch block 21  e.printStackTrace();
22 } catch (IOException e) {
23 // TODO Auto-generated catch block 24  e.printStackTrace();
25  }
26  }
27 }
复制代码

上面两种情况的对比归纳,理解的时候,脑子里要有XML节点的图:

3、使用DOM解析XML文件的节点名和节点值

再来看XML的代码:

复制代码
 1 <?xml version="1.0" encoding="UTF-8"?>  2 <bookstore>  3 <book id="1"> 换行符算一个子节点,这里是第一个
 4 <name>冰与火之歌</name> 第二个换行符
 5 <author>乔治马丁</author> 第三个
 6 <year>2014</year> 第四个
 7 <price>89</price> 第五个,所以加上正儿八经的四个节点,一共9个子节点
 8 </book>  9 <book id="2"> 10 <name>安徒生童话</name> 11 <year>2004</year> 12 <price>77</price> 13 <language>English</language> 14 </book> 15 </bookstore>
复制代码

下面进行解析子节点:

获取节点名

获取节点值:

因为一个节点转为Element类型之后,比如<name>冰火之歌</name>中,冰火之歌就不是该节点的值NodeValue而是该节点的子节点。

两种获取子节点的value:


相关文章
|
2月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
78 13
用深度学习提升DOM解析——自动提取页面关键区块
|
3月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
|
4月前
|
存储 Java 文件存储
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— logback.xml 配置文件解析
本文解析了 `logback.xml` 配置文件的详细内容,包括日志输出格式、存储路径、控制台输出及日志级别等关键配置。通过定义 `LOG_PATTERN` 和 `FILE_PATH`,设置日志格式与存储路径;利用 `&lt;appender&gt;` 节点配置控制台和文件输出,支持日志滚动策略(如文件大小限制和保存时长);最后通过 `&lt;logger&gt;` 和 `&lt;root&gt;` 定义日志级别与输出方式。此配置适用于精细化管理日志输出,满足不同场景需求。
371 1
|
4月前
|
机器学习/深度学习 人工智能 Java
Java机器学习实战:基于DJL框架的手写数字识别全解析
在人工智能蓬勃发展的今天,Python凭借丰富的生态库(如TensorFlow、PyTorch)成为AI开发的首选语言。但Java作为企业级应用的基石,其在生产环境部署、性能优化和工程化方面的优势不容忽视。DJL(Deep Java Library)的出现完美填补了Java在深度学习领域的空白,它提供了一套统一的API,允许开发者无缝对接主流深度学习框架,将AI模型高效部署到Java生态中。本文将通过手写数字识别的完整流程,深入解析DJL框架的核心机制与应用实践。
223 3
|
4月前
|
存储 设计模式 Java
重学Java基础篇—ThreadLocal深度解析与最佳实践
ThreadLocal 是一种实现线程隔离的机制,为每个线程创建独立变量副本,适用于数据库连接管理、用户会话信息存储等场景。
141 5
|
4月前
|
存储 监控 安全
重学Java基础篇—类的生命周期深度解析
本文全面解析了Java类的生命周期,涵盖加载、验证、准备、解析、初始化、使用及卸载七个关键阶段。通过分阶段执行机制详解(如加载阶段的触发条件与技术实现),结合方法调用机制、内存回收保护等使用阶段特性,以及卸载条件和特殊场景处理,帮助开发者深入理解JVM运作原理。同时,文章探讨了性能优化建议、典型异常处理及新一代JVM特性(如元空间与模块化系统)。总结中强调安全优先、延迟加载与动态扩展的设计思想,并提供开发建议与进阶方向,助力解决性能调优、内存泄漏排查及框架设计等问题。
157 5
|
4月前
|
Java 开发者
重学Java基础篇—Java类加载顺序深度解析
本文全面解析Java类的生命周期与加载顺序,涵盖从加载到卸载的七个阶段,并深入探讨初始化阶段的执行规则。通过单类、继承体系的实例分析,明确静态与实例初始化的顺序。同时,列举六种触发初始化的场景及特殊场景处理(如接口初始化)。提供类加载完整流程图与记忆口诀,助于理解复杂初始化逻辑。此外,针对空指针异常等问题提出排查方案,并给出最佳实践建议,帮助开发者优化程序设计、定位BUG及理解框架机制。最后扩展讲解类加载器层次与双亲委派机制,为深入研究奠定基础。
146 0
|
4月前
|
安全 IDE Java
重学Java基础篇—Java Object类常用方法深度解析
Java中,Object类作为所有类的超类,提供了多个核心方法以支持对象的基本行为。其中,`toString()`用于对象的字符串表示,重写时应包含关键信息;`equals()`与`hashCode()`需成对重写,确保对象等价判断的一致性;`getClass()`用于运行时类型识别;`clone()`实现对象复制,需区分浅拷贝与深拷贝;`wait()/notify()`支持线程协作。此外,`finalize()`已过时,建议使用更安全的资源管理方式。合理运用这些方法,并遵循最佳实践,可提升代码质量与健壮性。
121 1
|
4月前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
119 15
|
SQL 存储 Java
Java 应用与数据库的关系| 学习笔记
快速学习 Java 应用与数据库的关系。
250 0
Java 应用与数据库的关系| 学习笔记

推荐镜像

更多