Java 解析XML的几种方法

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介:

XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。

XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。

基本的解析方式有两种,一种叫SAX,另一种叫DOM。

SAX是基于事件流的解析,DOM是基于XML文档树结构的解析。

假设我们XML的内容和结构如下: 

1
2
3
4
5
6
7
8
<? xml  version="1.0" encoding="UTF-8"?>
< employees >
< employee >
< name >ddviplinux</ name >
< sex >m</ sex >
< age >30</ age >
</ employee >
</ employees >

下面使用JAVA语言来实现DOM与SAX的XML文档生成与解析。 

首先定义一个操作XML文档的接口XmlDocument 它定义了XML文档的建立与解析的接口。

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package com.alisoft.facepay.framework.bean;
/**
*
* @author hongliang.dinghl
* 定义XML文档建立与解析的接口
*/
public interface XmlDocument {
/**
* 建立XML文档
* @param fileName 文件全路径名称
*/
public void createXml(String fileName);
/**
* 解析XML文档
* @param fileName 文件全路径名称
*/
public void parserXml(String fileName);
}


1.DOM生成和解析XML文档
 

为 XML 文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)。 

复制代码
  1 package com.alisoft.facepay.framework.bean; 
  2 import java.io.FileInputStream; 
  3 import java.io.FileNotFoundException; 
  4 import java.io.FileOutputStream; 
  5 import java.io.IOException; 
  6 import java.io.InputStream; 
  7 import java.io.PrintWriter; 
  8 import javax.xml.parsers.DocumentBuilder; 
  9 import javax.xml.parsers.DocumentBuilderFactory; 
 10 import javax.xml.parsers.ParserConfigurationException; 
 11 import javax.xml.transform.OutputKeys; 
 12 import javax.xml.transform.Transformer; 
 13 import javax.xml.transform.TransformerConfigurationException; 
 14 import javax.xml.transform.TransformerException; 
 15 import javax.xml.transform.TransformerFactory; 
 16 import javax.xml.transform.dom.DOMSource; 
 17 import javax.xml.transform.stream.StreamResult; 
 18 import org.w3c.dom.Document; 
 19 import org.w3c.dom.Element; 
 20 import org.w3c.dom.Node; 
 21 import org.w3c.dom.NodeList; 
 22 import org.xml.sax.SAXException; 
 23 /** 
 24 * 
 25 * @author hongliang.dinghl 
 26 * DOM生成与解析XML文档 
 27 */ 
 28 public class DomDemo implements XmlDocument { 
 29 private Document document; 
 30 private String fileName; 
 31 public void init() { 
 32 try { 
 33 DocumentBuilderFactory factory = DocumentBuilderFactory 
 34 .newInstance(); 
 35 DocumentBuilder builder = factory.newDocumentBuilder(); 
 36 this.document = builder.newDocument(); 
 37 } catch (ParserConfigurationException e) { 
 38 System.out.println(e.getMessage()); 
 39 } 
 40 } 
 41 public void createXml(String fileName) { 
 42 Element root = this.document.createElement("employees"); 
 43 this.document.appendChild(root); 
 44 Element employee = this.document.createElement("employee"); 
 45 Element name = this.document.createElement("name"); 
 46 name.appendChild(this.document.createTextNode("丁宏亮")); 
 47 employee.appendChild(name); 
 48 Element sex = this.document.createElement("sex"); 
 49 sex.appendChild(this.document.createTextNode("m")); 
 50 employee.appendChild(sex); 
 51 Element age = this.document.createElement("age"); 
 52 age.appendChild(this.document.createTextNode("30")); 
 53 employee.appendChild(age); 
 54 root.appendChild(employee); 
 55 TransformerFactory tf = TransformerFactory.newInstance(); 
 56 try { 
 57 Transformer transformer = tf.newTransformer(); 
 58 DOMSource source = new DOMSource(document); 
 59 transformer.setOutputProperty(OutputKeys.ENCODING, "gb2312"); 
 60 transformer.setOutputProperty(OutputKeys.INDENT, "yes"); 
 61 PrintWriter pw = new PrintWriter(new FileOutputStream(fileName)); 
 62 StreamResult result = new StreamResult(pw); 
 63 transformer.transform(source, result); 
 64 System.out.println("生成XML文件成功!"); 
 65 } catch (TransformerConfigurationException e) { 
 66 System.out.println(e.getMessage()); 
 67 } catch (IllegalArgumentException e) { 
 68 System.out.println(e.getMessage()); 
 69 } catch (FileNotFoundException e) { 
 70 System.out.println(e.getMessage()); 
 71 } catch (TransformerException e) { 
 72 System.out.println(e.getMessage()); 
 73 } 
 74 } 
 75 public void parserXml(String fileName) { 
 76 try { 
 77 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); 
 78 DocumentBuilder db = dbf.newDocumentBuilder(); 
 79 Document document = db.parse(fileName); 
 80 NodeList employees = document.getChildNodes(); 
 81 for (int i = 0; i < employees.getLength(); i++) { 
 82 Node employee = employees.item(i); 
 83 NodeList employeeInfo = employee.getChildNodes(); 
 84 for (int j = 0; j < employeeInfo.getLength(); j++) { 
 85 Node node = employeeInfo.item(j); 
 86 NodeList employeeMeta = node.getChildNodes(); 
 87 for (int k = 0; k < employeeMeta.getLength(); k++) { 
 88 System.out.println(employeeMeta.item(k).getNodeName() 
 89 + ":" + employeeMeta.item(k).getTextContent()); 
 90 } 
 91 } 
 92 } 
 93 System.out.println("解析完毕"); 
 94 } catch (FileNotFoundException e) { 
 95 System.out.println(e.getMessage()); 
 96 } catch (ParserConfigurationException e) { 
 97 System.out.println(e.getMessage()); 
 98 } catch (SAXException e) { 
 99 System.out.println(e.getMessage()); 
100 } catch (IOException e) { 
101 System.out.println(e.getMessage()); 
102 } 
103 } 
104 } 
复制代码

 

2.SAX生成和解析XML文档

使用SAXReader需要导入dom4j-full.jar包。

dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的。dom4j是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。

使用举例:

 s.xml内容

<?xml version="1.0" encoding="GB2312"?>  
<data>  
    <row queryDTO.enterpriseId="gfd" queryDTO.loginName="gdfg" queryDTO.state="0"/>  
</data>  

解析

复制代码
复制代码
import java.io.File;  
import java.io.FileInputStream;  
import java.io.FileNotFoundException;  
import java.util.Iterator;  
import java.util.List;  
import org.dom4j.Document;  
import org.dom4j.DocumentException;  
import org.dom4j.Element;  
import org.dom4j.io.SAXReader;  
import org.dom4j.tree.AbstractAttribute;  
  
public class ReadXMLTest {  
      
    public static void main(String[] args){  
        File xmlFile = new File("C:/s.xml");  
        FileInputStream fis = null;  
        try {  
            fis = new FileInputStream(xmlFile);  
        } catch (FileNotFoundException e) {  
            e.printStackTrace();  
            System.err.println("File is not exsit!");  
        }  
          
        SAXReader saxReader = new SAXReader();  
        List rowList = null;  
        try {  
            //生成文档对应实体  
            Document doc = saxReader.read(fis);  
            //获取指定路径下的元素列表,这里指获取所有的data下的row元素  
            rowList = doc.selectNodes("//data/row");  
        } catch (DocumentException e) {  
            e.printStackTrace();  
        }  
          
          
        for(Iterator iter = rowList.iterator();iter.hasNext();){  
            //获得具体的row元素   
            Element element = (Element)iter.next();  
            //获得row元素的所有属性列表  
            List elementList = element.attributes();  
            for(Iterator iter1 = elementList.iterator();iter1.hasNext();){  
                //将每个属性转化为一个抽象属性,然后获取其名字和值  
                AbstractAttribute aa = (AbstractAttribute)iter1.next();  
                System.out.println("Name:"+aa.getName()+";Value:"+aa.getValue());  
            }  
                            //输出:  
                            //Name:queryDTO.enterpriseId;Value:gfd  
                            //Name:queryDTO.loginName;Value:gdfg  
                            //Name:queryDTO.state;Value:0  
            System.out.println(element.getName());  
                            //输出:  
                            //row  
            // 取得row元素的queryDTO.enterpriseId属性的值  
            System.out.println(element.attributeValue("queryDTO.enterpriseId"));  
                            //输出:  
                            //gfd  
            //如果element下有子元素,(类似width="**"),要想获得该子元素的值,可以用如下方法  
            System.out.println(element.elementText("width"));//因为没有,所以输出为null。  
        }  
          
    }  
}  
复制代码
复制代码

3.DOM4J生成和解析XML文档

DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。

Java代码

复制代码
 1 package com.alisoft.facepay.framework.bean;   
 2 import java.io.File;   
 3 import java.io.FileWriter;   
 4 import java.io.IOException;   
 5 import java.io.Writer;   
 6 import java.util.Iterator;   
 7 
 8 import org.dom4j.Document;   
 9 import org.dom4j.DocumentException;   
10 import org.dom4j.DocumentHelper;   
11 import org.dom4j.Element;   
12 import org.dom4j.io.SAXReader;   
13 import org.dom4j.io.XMLWriter;   
14 /**  
15 *   
16 * @author hongliang.dinghl  
17 * Dom4j 生成XML文档与解析XML文档  
18 */  
19 public class Dom4jDemo implements XmlDocument {   
20 
21 public void createXml(String fileName) {   
22 Document document = DocumentHelper.createDocument();   
23 Element employees=document.addElement("employees");   
24 Element employee=employees.addElement("employee");   
25 Element name= employee.addElement("name");   
26 name.setText("ddvip");   
27 Element sex=employee.addElement("sex");   
28 sex.setText("m");   
29 Element age=employee.addElement("age");   
30 age.setText("29");   
31 try {   
32 Writer fileWriter=new FileWriter(fileName);   
33 XMLWriter xmlWriter=new XMLWriter(fileWriter);   
34 xmlWriter.write(document);   
35 xmlWriter.close();   
36 } catch (IOException e) {   
37 
38 System.out.println(e.getMessage());   
39 }   
40 
41 
42 }   
43 
44 
45 public void parserXml(String fileName) {   
46 File inputXml=new File(fileName);   
47 SAXReader saxReader = new SAXReader();   
48 try {   
49 Document document = saxReader.read(inputXml);   
50 Element employees=document.getRootElement();   
51 for(Iterator i = employees.elementIterator(); i.hasNext();){   
52 Element employee = (Element) i.next();   
53 for(Iterator j = employee.elementIterator(); j.hasNext();){   
54 Element node=(Element) j.next();   
55 System.out.println(node.getName()+":"+node.getText());   
56 }   
57 
58 }   
59 } catch (DocumentException e) {   
60 System.out.println(e.getMessage());   
61 }   
62 System.out.println("dom4j parserXml");   
63 }   
64 }    
复制代码

4.JDOM生成和解析XML  

为减少DOM、SAX的编码量,出现了JDOM;优点:20-80原则,极大减少了代码量。使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。   

复制代码
 1 package com.alisoft.facepay.framework.bean;   
 2 
 3 import java.io.FileNotFoundException;   
 4 import java.io.FileOutputStream;   
 5 import java.io.IOException;   
 6 import java.util.List;   
 7 
 8 import org.jdom.Document;   
 9 import org.jdom.Element;   
10 import org.jdom.JDOMException;   
11 import org.jdom.input.SAXBuilder;   
12 import org.jdom.output.XMLOutputter;   
13 /**  
14 *   
15 * @author hongliang.dinghl  
16 * JDOM 生成与解析XML文档  
17 *   
18 */  
19 public class JDomDemo implements XmlDocument {   
20 
21 public void createXml(String fileName) {   
22 Document document;   
23 Element  root;   
24 root=new Element("employees");   
25 document=new Document(root);   
26 Element employee=new Element("employee");   
27 root.addContent(employee);   
28 Element name=new Element("name");   
29 name.setText("ddvip");   
30 employee.addContent(name);   
31 Element sex=new Element("sex");   
32 sex.setText("m");   
33 employee.addContent(sex);   
34 Element age=new Element("age");   
35 age.setText("23");   
36 employee.addContent(age);   
37 XMLOutputter XMLOut = new XMLOutputter();   
38 try {   
39 XMLOut.output(document, new FileOutputStream(fileName));   
40 } catch (FileNotFoundException e) {   
41 e.printStackTrace();   
42 } catch (IOException e) {   
43 e.printStackTrace();   
44 }   
45 
46 }   
47 
48 public void parserXml(String fileName) {   
49 SAXBuilder builder=new SAXBuilder(false);    
50 try {   
51 Document document=builder.build(fileName);   
52 Element employees=document.getRootElement();    
53 List employeeList=employees.getChildren("employee");   
54 for(int i=0;i<employeelist.size();i++){ <br="">Element employee=(Element)employeeList.get(i);   
55 List employeeInfo=employee.getChildren();   
56 for(int j=0;j<employeeinfo.size();j++){ <br="">System.out.println(((Element)employeeInfo.get(j)).getName()+":"+((Element)employeeInfo.get(j)).getValue());   
57 
58 }   
59 }   
60 } catch (JDOMException e) {   
61 
62 e.printStackTrace();   
63 } catch (IOException e) {   
64 
65 e.printStackTrace();   
66 }    
67 
68 }   
69 }   
复制代码

 


本文转自邴越博客园博客,原文链接:http://www.cnblogs.com/binyue/p/3388689.html,如需转载请自行联系原作者
相关文章
|
21天前
|
安全 Ubuntu Shell
深入解析 vsftpd 2.3.4 的笑脸漏洞及其检测方法
本文详细解析了 vsftpd 2.3.4 版本中的“笑脸漏洞”,该漏洞允许攻击者通过特定用户名和密码触发后门,获取远程代码执行权限。文章提供了漏洞概述、影响范围及一个 Python 脚本,用于检测目标服务器是否受此漏洞影响。通过连接至目标服务器并尝试登录特定用户名,脚本能够判断服务器是否存在该漏洞,并给出相应的警告信息。
141 84
|
3天前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
44 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
2天前
|
数据可视化 项目管理
个人和团队都好用的年度复盘工具:看板与KPT方法解析
本文带你了解高效方法KPT复盘法(Keep、Problem、Try),结合看板工具,帮助你理清头绪,快速完成年度复盘。
26 7
个人和团队都好用的年度复盘工具:看板与KPT方法解析
|
10天前
|
存储 缓存 Java
Java 并发编程——volatile 关键字解析
本文介绍了Java线程中的`volatile`关键字及其与`synchronized`锁的区别。`volatile`保证了变量的可见性和一定的有序性,但不能保证原子性。它通过内存屏障实现,避免指令重排序,确保线程间数据一致。相比`synchronized`,`volatile`性能更优,适用于简单状态标记和某些特定场景,如单例模式中的双重检查锁定。文中还解释了Java内存模型的基本概念,包括主内存、工作内存及并发编程中的原子性、可见性和有序性。
Java 并发编程——volatile 关键字解析
|
8天前
|
Java 数据库连接 Spring
反射-----浅解析(Java)
在java中,我们可以通过反射机制,知道任何一个类的成员变量(成员属性)和成员方法,也可以堆任何一个对象,调用这个对象的任何属性和方法,更进一步我们还可以修改部分信息和。
|
20天前
|
存储 Java 开发者
浅析JVM方法解析、创建和链接
上一篇文章《你知道Java类是如何被加载的吗?》分析了HotSpot是如何加载Java类的,本文再来分析下Hotspot又是如何解析、创建和链接类方法的。
|
30天前
|
存储 算法 Java
Java内存管理深度解析####
本文深入探讨了Java虚拟机(JVM)中的内存分配与垃圾回收机制,揭示了其高效管理内存的奥秘。文章首先概述了JVM内存模型,随后详细阐述了堆、栈、方法区等关键区域的作用及管理策略。在垃圾回收部分,重点介绍了标记-清除、复制算法、标记-整理等多种回收算法的工作原理及其适用场景,并通过实际案例分析了不同GC策略对应用性能的影响。对于开发者而言,理解这些原理有助于编写出更加高效、稳定的Java应用程序。 ####
|
30天前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
2月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
86 2
|
9天前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析

推荐镜像

更多