dom4j解析xml文件简单版

简介: 1. 获取xml信息/*** 获取xml信息* @param filename 文件相对路径*/public static Document load(String filename) { Document document = null; try { S...

1. 获取xml信息

/**
* 获取xml信息
* @param filename 文件相对路径
*/
public static Document load(String filename) {
    Document document = null;
    try {
        SAXReader saxReader = new SAXReader();
        //使用spring的文件读取方法:org.springframework.core.io.Resource
        Resource resource = new ClassPathResource(filename);
        document = saxReader.read(resource.getFile()); // 读取XML文件,获得document对象
    } catch (Exception ex) {
        ex.printStackTrace();
    }
    return document;
}

reader的read方法是重载的,可以从InputStream, File, Url等多种不同的源来读取。得到的Document对象就代表了整个XML。
读取的字符编码是按照XML文件头定义的编码来转换。如果遇到乱码问题,注意要把各处的编码名称保持一致即可

获取根节点

root元素是xml文档的根节点。一切XML分析都是从Root元素开始的

#获取xml文档    
Document document = load("conf/test.xml");
#获取xml的根节点
Element root = document.getRootElement();

2. 常用到的方法

#获得根元素下的所有子节点。 
List<Element> elementList=root.elements();
#获得element节点的名字    
String elementName=element.getName();
#获得element节点的文本节点值    
String elementValue=element.getText(); 
#获得element节点的属性  
Attribute attribute=element.attribute();
#获得属性值
String attrValue=element.attributeValue("attrName");

3. xml遍历

xml节点的遍历有如下方式:

//方式一: 枚举所有子节点 
for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
    Element element = (Element) i.next();
    //TODO 获取相关节点信息和操作
}
//方式二: 枚举名称为foo的节点 
for ( Iterator i = root.elementIterator(foo); i.hasNext();) {
    Element foo = (Element) i.next();
    //TODO 获取相关节点信息和操作 
}
//方式三 枚举属性
for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
    Attribute attribute = (Attribute) i.next();
    //TODO 获取相关节点信息和操作 
}
//方式四: 循环遍历子节点 
List<Element> elementList=root.elements();
for(int i=0;i<elementList.size(); i++){
    Element element = (Element) elementList.get(i);
    //TODO 获取相关节点信息和操作

    //子节点遍历
    List elementRoot = element.elements();
    //判断是否存在子节点
    if(null!=elementRoot && elementRoot.size()>0){
        //递归调用此方法
        //TODO 相关操作
    }    
}
目录
相关文章
|
4月前
|
XML 数据采集 API
用Lxml高效解析XML格式数据:以天气API为例
免费Python教程:实战解析中国天气网XML数据,详解Lxml库高效解析技巧、XPath用法、流式处理大文件及IP封禁应对策略,助你构建稳定数据采集系统。
283 0
|
11月前
|
存储 Java 文件存储
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— logback.xml 配置文件解析
本文解析了 `logback.xml` 配置文件的详细内容,包括日志输出格式、存储路径、控制台输出及日志级别等关键配置。通过定义 `LOG_PATTERN` 和 `FILE_PATH`,设置日志格式与存储路径;利用 `&lt;appender&gt;` 节点配置控制台和文件输出,支持日志滚动策略(如文件大小限制和保存时长);最后通过 `&lt;logger&gt;` 和 `&lt;root&gt;` 定义日志级别与输出方式。此配置适用于精细化管理日志输出,满足不同场景需求。
2749 1
|
9月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
338 13
用深度学习提升DOM解析——自动提取页面关键区块
|
9月前
|
Android开发 开发者
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
本文详细介绍了如何通过自定义 `attrs.xml` 文件实现 Android 自定义 View 的属性配置。以一个包含 TextView 和 ImageView 的 DemoView 为例,讲解了如何使用自定义属性动态改变文字内容和控制图片显示隐藏。同时,通过设置布尔值和点击事件,实现了图片状态的切换功能。代码中展示了如何在构造函数中解析自定义属性,并通过方法 `setSetting0n` 和 `setbackeguang` 实现功能逻辑的优化与封装。此示例帮助开发者更好地理解自定义 View 的开发流程与 attrs.xml 的实际应用。
269 2
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
|
11月前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
440 15
|
10月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
282 0
|
Java Maven
maven项目的pom.xml文件常用标签使用介绍
第四届人文,智慧教育与服务管理国际学术会议(HWESM 2025) 2025 4th International Conference on Humanities, Wisdom Education and Service Management
1154 8
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
319 1
|
XML Java 数据格式
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
这篇文章是Spring5框架的实战教程,主要介绍了如何在Spring的IOC容器中通过XML配置方式使用外部属性文件来管理Bean,特别是数据库连接池的配置。文章详细讲解了创建属性文件、引入属性文件到Spring配置、以及如何使用属性占位符来引用属性文件中的值。
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)

相关课程

更多

推荐镜像

更多
  • DNS