Android 创建与解析XML(五)—— Dom4j方式

简介:

http://blog.csdn.net/sunboy_2050/article/details/7521605

1、Dom4j概述

dom4j is an easy to use, open source library for working with XML, XPath and XSLT on the Java platform using the Java Collections Framework and with full support for DOM, SAX and JAXP. 

dom4j官方网址:dom4j

dom4j源码下载:dom4j download

本示例中,需要导入dom4j.jar包,才能引用dom4j相关类,dom4j源码和jar包,请见本示例【源码下载】或访问 dom4j


org.dom4j包,不仅包含创建xml的构建器类DocumentHelper、Element,而且还包含解析xml的解析器SAXReader、Element,包含类如下:

org.dom4j

org.dom4j.DocumentHelper;

org.dom4j.Element;

org.dom4j.io.SAXReader;

org.dom4j.io.XMLWriter;

org.dom4j.DocumentException;

sdk源码查看路径google code


创建和解析xml的效果图:




2、Dom4j 创建 XML

Dom4j,创建xml主要用到了org.dom4j.DocumentHelper、org.dom4j.Document、org.dom4j.io.OutputFormat、org.dom4j.io.XMLWriter

首先,DocumentHelper.createDocument(),创建 org.dom4j.Document 的实例 doc

接着,通过doc,设置xml属性doc.setXMLEncoding("utf-8")、doc.addElement("root")根节点,以及子节点等

然后,定义xml格式并输出,new XMLWriter(xmlWriter, outputFormat)

Code

[java]  view plain copy print ?
  1. /** Dom4j方式,创建 XML  */  
  2. public String dom4jXMLCreate(){  
  3.     StringWriter xmlWriter = new StringWriter();  
  4.   
  5.     Person []persons = new Person[3];       // 创建节点Person对象  
  6.     persons[0] = new Person(1"sunboy_2050""http://blog.csdn.net/sunboy_2050");  
  7.     persons[1] = new Person(2"baidu""http://www.baidu.com");  
  8.     persons[2] = new Person(3"google""http://www.google.com");  
  9.       
  10.     try {  
  11.         org.dom4j.Document doc = DocumentHelper.createDocument();  
  12.           
  13.         doc.setXMLEncoding("utf-8");  
  14.           
  15.         org.dom4j.Element eleRoot = doc.addElement("root");  
  16.         eleRoot.addAttribute("author""homer");  
  17.         eleRoot.addAttribute("date""2012-04-25");  
  18.         eleRoot.addComment("dom4j test");  
  19.           
  20.         int personsLen = persons.length;  
  21.         for(int i=0; i<personsLen; i++){  
  22.               
  23.             Element elePerson = eleRoot.addElement("person");   // 创建person节点,引用类为 org.dom4j.Element  
  24.               
  25.             Element eleId = elePerson.addElement("id");  
  26.             eleId.addText(persons[i].getId()+"");  
  27.               
  28.             Element eleName = elePerson.addElement("name");  
  29.             eleName.addText(persons[i].getName());  
  30.               
  31.             Element eleBlog = elePerson.addElement("blog");  
  32.             eleBlog.addText(persons[i].getBlog());  
  33.         }  
  34.   
  35.         org.dom4j.io.OutputFormat outputFormat = new org.dom4j.io.OutputFormat();   // 设置xml输出格式  
  36.         outputFormat.setEncoding("utf-8");  
  37.         outputFormat.setIndent(false);  
  38.         outputFormat.setNewlines(true);  
  39.         outputFormat.setTrimText(true);  
  40.           
  41.         org.dom4j.io.XMLWriter output = new XMLWriter(xmlWriter, outputFormat);     // 保存xml  
  42.         output.write(doc);  
  43.         output.close();  
  44.     } catch (Exception e) {  
  45.         e.printStackTrace();  
  46.     }  
  47.       
  48.     savedXML(fileName, xmlWriter.toString());  
  49.     return xmlWriter.toString();  
  50. }  

运行结果:




3、Dom4j 解析 XML

Dom4j,解析xml主要用到了org.dom4j.io.SAXReader、org.dom4j.Document、doc.getRootElement(),以及ele.getName()、ele.getText()等

首先,创建SAXReader的实例reader,读入xml字节流 reader.read(is)

接着,通过doc.getRootElement()得到root根节点,利用迭代器取得root下一级的子节点eleRoot.elementIterator()等

然后,得到解析的xml内容xmlWriter.append(xmlHeader)、xmlWriter.append(personsList.get(i).toString())


解析一:标准解析(Iterator 迭代)

Code

[java]  view plain copy print ?
  1. /** Dom4j方式,解析 XML  */  
  2. public String dom4jXMLResolve(){  
  3.     StringWriter xmlWriter = new StringWriter();  
  4.       
  5.     InputStream is = readXML(fileName);  
  6.     try {  
  7.         SAXReader reader = new SAXReader();  
  8.         org.dom4j.Document doc = reader.read(is);  
  9.   
  10.         List<Person> personsList = null;  
  11.         Person person = null;  
  12.         StringBuffer xmlHeader = new StringBuffer();  
  13.           
  14.           
  15.         Element eleRoot = doc.getRootElement();     // 获得root根节点,引用类为 org.dom4j.Element  
  16.         String attrAuthor = eleRoot.attributeValue("author");  
  17.         String attrDate = eleRoot.attributeValue("date");  
  18.         xmlHeader.append("root").append("\t\t");  
  19.         xmlHeader.append(attrAuthor).append("\t");  
  20.         xmlHeader.append(attrDate).append("\n");  
  21.         personsList = new ArrayList<Person>();  
  22.           
  23.         // 获取root子节点,即person  
  24.         Iterator<Element> iter = eleRoot.elementIterator();  
  25.         for(; iter.hasNext(); ) {  
  26.             Element elePerson = (Element)iter.next();  
  27.               
  28.             if("person".equals(elePerson.getName())){  
  29.                 person = new Person();  
  30.                   
  31.                 // 获取person子节点,即id、name、blog  
  32.                 Iterator<Element> innerIter = elePerson.elementIterator();  
  33.                 for(; innerIter.hasNext();) {  
  34.                     Element ele = (Element)innerIter.next();  
  35.                       
  36.                     if("id".equals(ele.getName())) {  
  37.                         String id = ele.getText();  
  38.                         person.setId(Integer.parseInt(id));  
  39.                     } else if("name".equals(ele.getName())) {  
  40.                         String name = ele.getText();  
  41.                         person.setName(name);  
  42.                     } else if("blog".equals(ele.getName())) {  
  43.                         String blog = ele.getText();  
  44.                         person.setBlog(blog);  
  45.                     }  
  46.                 }  
  47.                   
  48.                 personsList.add(person);  
  49.                 person = null;  
  50.             }  
  51.         }  
  52.           
  53.         xmlWriter.append(xmlHeader);  
  54.         int personsLen = personsList.size();  
  55.         for(int i=0; i<personsLen; i++) {  
  56.             xmlWriter.append(personsList.get(i).toString());  
  57.         }  
  58.           
  59.     } catch (DocumentException e) {  
  60.         e.printStackTrace();  
  61.     } catch (Exception e) {  
  62.         e.printStackTrace();  
  63.     }  
  64.       
  65.     return xmlWriter.toString();  
  66. }  

运行结果:



解析二:选择性解析(XPath路径

Dom4j+XPath,选择性只解析id,doc.selectNodes("//root//person//id")

Code

[java]  view plain copy print ?
  1. /** Dom4j方式,解析 XML(方式二)  */  
  2. public String dom4jXMLResolve2(){  
  3.     StringWriter xmlWriter = new StringWriter();  
  4.       
  5.     InputStream is = readXML(fileName);  
  6.     try {  
  7.         org.dom4j.io.SAXReader reader = new org.dom4j.io.SAXReader();  
  8.         org.dom4j.Document doc = reader.read(is);  
  9.   
  10.         List<Person> personsList = null;  
  11.         Person person = null;  
  12.         StringBuffer xmlHeader = new StringBuffer();  
  13.           
  14.           
  15.         Element eleRoot = doc.getRootElement();     // 获得root根节点,引用类为 org.dom4j.Element  
  16.         String attrAuthor = eleRoot.attributeValue("author");  
  17.         String attrDate = eleRoot.attributeValue("date");  
  18.         xmlHeader.append("root").append("\t\t");  
  19.         xmlHeader.append(attrAuthor).append("\t");  
  20.         xmlHeader.append(attrDate).append("\n");  
  21.         personsList = new ArrayList<Person>();  
  22.           
  23.         @SuppressWarnings("unchecked")  
  24.         List<Element> idList = (List<Element>) doc.selectNodes("//root//person//id");   // 选择性获取全部id  
  25.         Iterator<Element> idIter = idList.iterator();  
  26.         while(idIter.hasNext()){  
  27.             person = new Person();  
  28.               
  29.             Element idEle = (Element)idIter.next();  
  30.             String id = idEle.getText();  
  31.             person.setId(Integer.parseInt(id));  
  32.               
  33.             personsList.add(person);  
  34.         }  
  35.   
  36.         xmlWriter.append(xmlHeader);  
  37.         int personsLen = personsList.size();  
  38.         for(int i=0; i<personsLen; i++) {  
  39.             xmlWriter.append("id = ").append(personsList.get(i).getId()+"").append("\n");  
  40.         }  
  41.           
  42.     } catch (DocumentException e) {  
  43.         e.printStackTrace();  
  44.     } catch (Exception e) {  
  45.         e.printStackTrace();  
  46.     }  
  47.       
  48.     return xmlWriter.toString();  
  49. }  

注:借助 XPath 解析 XML 时,需要导入 jaxen;本示例需要导入的是最新的jaxen包jaxen-1.1.3.jar,可以下载本示例下面【源码下载】或 访问 jaxen jar

Jaxen is an open source XPath library written in Java. It is adaptable to many different object models, including DOM, XOM, dom4j, and JDOM. Is it also possible to write adapters that treat non-XML trees such as compiled Java byte code or Java beans as XML, thus enabling you to query these trees with XPath too.

jaxen 官方网址:jaxen

jaxen下载jar包:jaxen jar 或 jaxen jar

jaxen源码查看:jaxen src 或 jaxen trunk


运行结果:




相关文章
|
7月前
|
存储 Java 文件存储
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— logback.xml 配置文件解析
本文解析了 `logback.xml` 配置文件的详细内容,包括日志输出格式、存储路径、控制台输出及日志级别等关键配置。通过定义 `LOG_PATTERN` 和 `FILE_PATH`,设置日志格式与存储路径;利用 `&lt;appender&gt;` 节点配置控制台和文件输出,支持日志滚动策略(如文件大小限制和保存时长);最后通过 `&lt;logger&gt;` 和 `&lt;root&gt;` 定义日志级别与输出方式。此配置适用于精细化管理日志输出,满足不同场景需求。
1646 1
|
5月前
|
机器学习/深度学习 数据采集 JavaScript
用深度学习提升DOM解析——自动提取页面关键区块
本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。
159 13
用深度学习提升DOM解析——自动提取页面关键区块
|
5月前
|
Android开发 开发者
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
本文详细介绍了如何通过自定义 `attrs.xml` 文件实现 Android 自定义 View 的属性配置。以一个包含 TextView 和 ImageView 的 DemoView 为例,讲解了如何使用自定义属性动态改变文字内容和控制图片显示隐藏。同时,通过设置布尔值和点击事件,实现了图片状态的切换功能。代码中展示了如何在构造函数中解析自定义属性,并通过方法 `setSetting0n` 和 `setbackeguang` 实现功能逻辑的优化与封装。此示例帮助开发者更好地理解自定义 View 的开发流程与 attrs.xml 的实际应用。
Android自定义View之不得不知道的文件attrs.xml(自定义属性)
|
11月前
|
Java 开发工具 Android开发
Android与iOS开发环境搭建全解析####
本文深入探讨了Android与iOS两大移动操作系统的开发环境搭建流程,旨在为初学者及有一定基础的开发者提供详尽指南。我们将从开发工具的选择、环境配置到第一个简单应用的创建,一步步引导读者步入移动应用开发的殿堂。无论你是Android Studio的新手还是Xcode的探索者,本文都将为你扫清开发道路上的障碍,助你快速上手并享受跨平台移动开发的乐趣。 ####
|
7月前
|
XML JavaScript Android开发
【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
本文总结了Android中几种常用的网络技术,包括WebView、HttpURLConnection、OKHttp和XML的Pull解析方式。每种技术都有其独特的特点和适用场景。理解并熟练运用这些技术,可以帮助开发者构建高效、可靠的网络应用程序。通过示例代码和详细解释,本文为开发者提供了实用的参考和指导。
177 15
|
7月前
|
监控 Shell Linux
Android调试终极指南:ADB安装+多设备连接+ANR日志抓取全流程解析,覆盖环境变量配置/多设备调试/ANR日志分析全流程,附Win/Mac/Linux三平台解决方案
ADB(Android Debug Bridge)是安卓开发中的重要工具,用于连接电脑与安卓设备,实现文件传输、应用管理、日志抓取等功能。本文介绍了 ADB 的基本概念、安装配置及常用命令。包括:1) 基本命令如 `adb version` 和 `adb devices`;2) 权限操作如 `adb root` 和 `adb shell`;3) APK 操作如安装、卸载应用;4) 文件传输如 `adb push` 和 `adb pull`;5) 日志记录如 `adb logcat`;6) 系统信息获取如屏幕截图和录屏。通过这些功能,用户可高效调试和管理安卓设备。
|
6月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
118 0
|
10月前
|
存储 Linux API
深入探索Android系统架构:从内核到应用层的全面解析
本文旨在为读者提供一份详尽的Android系统架构分析,从底层的Linux内核到顶层的应用程序框架。我们将探讨Android系统的模块化设计、各层之间的交互机制以及它们如何共同协作以支持丰富多样的应用生态。通过本篇文章,开发者和爱好者可以更深入理解Android平台的工作原理,从而优化开发流程和提升应用性能。
|
11月前
|
安全 Java Linux
深入解析Android系统架构及其对开发者的意义####
【10月更文挑战第21天】 本文旨在为读者揭开Android操作系统架构的神秘面纱,探讨其如何塑造现代移动应用开发格局。通过剖析Linux内核、硬件抽象层、运行时环境及应用程序框架等关键组件,揭示Android平台的强大功能与灵活性。文章强调了理解Android架构对于开发者优化应用性能、提升用户体验的重要性,并展望了未来技术趋势下Android的发展方向。 ####
347 0
|
12月前
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
228 1

热门文章

最新文章

推荐镜像

更多
  • DNS