JAVA解析XML

简介:

在JAVA中最常用的解析xml的方式有四种,分别为:sax、dom、dom4j、jdom。sax方式的解析是基于事件的,比较适合大数据的解析,而dom的方式会将xml加载到内存中,构建出dom树,解析大文件时容易造成内存溢出,在实际开发中,我们应该选择最合适的解析方式。

假设我们有这样一个xml文件:

<xml>
   <userId><![CDATA[jianggujin]]></userId>
   <userName><![CDATA[蒋固金]]></userName>
   <birthday>1994-12-01</birthday>
</xml>

通过观察这段xml,我们可以将其抽象成一个实体类,取名为UserInfo

import java.text.MessageFormat;

public class UserInfo
{
   private String userId;
   private String userName;
   private String birthday;

   public String getUserId()
   {
      return userId;
   }

   public void setUserId(String userId)
   {
      this.userId = userId;
   }

   public String getUserName()
   {
      return userName;
   }

   public void setUserName(String userName)
   {
      this.userName = userName;
   }

   public String getBirthday()
   {
      return birthday;
   }

   public void setBirthday(String birthday)
   {
      this.birthday = birthday;
   }

   @Override
   public String toString()
   {
      return MessageFormat.format("[userId:{0},userName:{1},birthday:{2}]",
            userId, userName, birthday);
   }
}

为了使用方便,将这段xml抽出来放在一个接口中,这样就不需要每个解析类里面都写一遍了,只需要实现这个接口就行了。

public interface XMLContent
{
   public String XML = "<xml><userId><![CDATA[jianggujin]]></userId><userName><![CDATA[蒋固金]]></userName><birthday>1994-12-01</birthday></xml>";
}

接下来,将演示四种方式解析xml的简单示例。

sax方式

sax方式需要一个解析的处理器,继承自org.xml.sax.helpers.DefaultHandler
在DefaultHandler中,我们可能需要重写的方法有如下几个:

返回值 方法名 说明
void startDocument() 接收文档开始的通知
void startElement(String uri, String localName, String qName, Attributes attributes) 接收元素开始的通知
void characters(char[] ch, int start, int length) 接收元素中字符数据的通知
void endElement(String uri, String localName, String qName) 接收元素结束的通知
void endDocument() 接收文档结束的通知

使用示例:

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

/**
 * Sax解析XML
 * 
 * @author jianggujin
 * 
 */
public class SaxParser extends DefaultHandler implements XMLContent
{
   private UserInfo userInfo = null;
   private String currentTag = null;

   @Override
   public void startDocument() throws SAXException
   {
      userInfo = new UserInfo();
      System.out.println("startDocument...");
   }

   @Override
   public void startElement(String uri, String localName, String qName,
         Attributes attributes) throws SAXException
   {
      System.out.println("startElement...");
      currentTag = qName;
   }

   @Override
   public void characters(char[] ch, int start, int length) throws SAXException
   {
      System.out.println("characters...");
      String value = new String(ch, start, length);
      System.out.println(value);
      if ("userId".equals(currentTag))
      {
         userInfo.setUserId(value);
      }
      else if ("userName".equals(currentTag))
      {
         userInfo.setUserName(value);
      }
      else if ("birthday".equals(currentTag))
      {
         userInfo.setBirthday(value);
      }
   }

   @Override
   public void endElement(String uri, String localName, String qName)
         throws SAXException
   {
      System.out.println("endElement...");
      currentTag = null;
   }

   @Override
   public void endDocument() throws SAXException
   {
      System.out.println("endDocument...");
   }

   private UserInfo getUserInfo()
   {
      return userInfo;
   }

   public static UserInfo parse(InputStream inputStream) throws SAXException,
         ParserConfigurationException, IOException
   {
      XMLReader reader = SAXParserFactory.newInstance().newSAXParser()
            .getXMLReader();
      SaxParser handler = new SaxParser();
      reader.setContentHandler(handler);
      reader.parse(new InputSource(inputStream));
      return handler.getUserInfo();
   }

   public static UserInfo parse(String xml) throws SAXException,
         ParserConfigurationException, IOException
   {
      return parse(new ByteArrayInputStream(xml.getBytes("UTF-8")));
   }

   public static void main(String[] args) throws Exception
   {
      System.out.println(parse(XML));
   }
}

DOM方式

import java.io.ByteArrayInputStream;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

/**
 * Dom方式解析XML
 * 
 * @author jianggujin
 * 
 */
public class DomParser implements XMLContent
{

   public static void main(String[] args) throws Exception
   {
      DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
      DocumentBuilder builder = factory.newDocumentBuilder();
      Document document = builder.parse(new ByteArrayInputStream(XML
            .getBytes("UTF-8")));
      UserInfo userInfo = new UserInfo();
      userInfo.setUserId(document.getElementsByTagName("userId").item(0)
            .getTextContent());
      userInfo.setUserName(document.getElementsByTagName("userName").item(0)
            .getTextContent());
      userInfo.setBirthday(document.getElementsByTagName("birthday").item(0)
            .getTextContent());
      System.out.println(userInfo);
   }
}

DOM4j方式

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;

/**
 * Dom4d方式解析XML
 * 
 * @author jianggujin
 * 
 */
public class Dom4jParser implements XMLContent
{

   public static void main(String[] args) throws Exception
   {
      Document document = DocumentHelper.parseText(XML);
      Element rootElement = document.getRootElement();

      UserInfo userInfo = new UserInfo();
      userInfo.setUserId(rootElement.elementText("userId"));
      userInfo.setUserName(rootElement.elementText("userName"));
      userInfo.setBirthday(rootElement.elementText("birthday"));
      System.out.println(userInfo);
   }
}

jDOM方式

import java.io.ByteArrayInputStream;

import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.input.SAXBuilder;

/**
 * JDom方式解析XML
 * 
 * @author jianggujin
 * 
 */
public class JDomParser implements XMLContent
{
   public static void main(String[] args) throws Exception
   {
      SAXBuilder builder = new SAXBuilder();
      Document document = builder.build(new ByteArrayInputStream(XML
            .getBytes("UTF-8")));
      Element rootElement = document.getRootElement();

      UserInfo userInfo = new UserInfo();
      userInfo.setUserId(rootElement.getChildText("userId"));
      userInfo.setUserName(rootElement.getChildText("userName"));
      userInfo.setBirthday(rootElement.getChildText("birthday"));
      System.out.println(userInfo);
   }
}

JAVA解析XML

目录
相关文章
|
26天前
|
Java
Java的CAS机制深度解析
CAS(Compare-And-Swap)是并发编程中的原子操作,用于实现多线程环境下的无锁数据同步。它通过比较内存值与预期值,决定是否更新值,从而避免锁的使用。CAS广泛应用于Java的原子类和并发包中,如AtomicInteger和ConcurrentHashMap,提升了并发性能。尽管CAS具有高性能、无死锁等优点,但也存在ABA问题、循环开销大及仅支持单变量原子操作等缺点。合理使用CAS,结合实际场景选择同步机制,能有效提升程序性能。
|
10天前
|
机器学习/深度学习 JSON Java
Java调用Python的5种实用方案:从简单到进阶的全场景解析
在机器学习与大数据融合背景下,Java与Python协同开发成为企业常见需求。本文通过真实案例解析5种主流调用方案,涵盖脚本调用到微服务架构,助力开发者根据业务场景选择最优方案,提升开发效率与系统性能。
130 0
|
5天前
|
Java 开发者
Java并发编程:CountDownLatch实战解析
Java并发编程:CountDownLatch实战解析
210 100
|
1月前
|
存储 缓存 Java
Java数组全解析:一维、多维与内存模型
本文深入解析Java数组的内存布局与操作技巧,涵盖一维及多维数组的声明、初始化、内存模型,以及数组常见陷阱和性能优化。通过图文结合的方式帮助开发者彻底理解数组本质,并提供Arrays工具类的实用方法与面试高频问题解析,助你掌握数组核心知识,避免常见错误。
|
2月前
|
人工智能 Cloud Native Java
2025 年 Java 应届生斩获高薪需掌握的技术实操指南与实战要点解析
本指南为2025年Java应届生打造,涵盖JVM调优、响应式编程、云原生、微服务、实时计算与AI部署等前沿技术,结合电商、数据处理等真实场景,提供可落地的技术实操方案,助力掌握高薪开发技能。
157 2
|
1月前
|
缓存 安全 Java
Java并发性能优化|读写锁与互斥锁解析
本文深入解析Java中两种核心锁机制——互斥锁与读写锁,通过概念对比、代码示例及性能测试,揭示其适用场景。互斥锁适用于写多或强一致性场景,读写锁则在读多写少时显著提升并发性能。结合锁降级、公平模式等高级特性,助你编写高效稳定的并发程序。
132 0
|
10天前
|
安全 Java API
Java SE 与 Java EE 区别解析及应用场景对比
在Java编程世界中,Java SE(Java Standard Edition)和Java EE(Java Enterprise Edition)是两个重要的平台版本,它们各自有着独特的定位和应用场景。理解它们之间的差异,对于开发者选择合适的技术栈进行项目开发至关重要。
53 1
|
1月前
|
存储 缓存 算法
Java数据类型与运算符深度解析
本文深入解析Java中容易混淆的基础知识,包括八大基本数据类型(如int、Integer)、自动装箱与拆箱机制,以及运算符(如&与&&)的使用区别。通过代码示例剖析内存布局、取值范围及常见陷阱,帮助开发者写出更高效、健壮的代码,并附有面试高频问题解析,夯实基础。
|
1月前
|
安全 Oracle Java
JAVA高级开发必备·卓伊凡详细JDK、JRE、JVM与Java生态深度解析-形象比喻系统理解-优雅草卓伊凡
JAVA高级开发必备·卓伊凡详细JDK、JRE、JVM与Java生态深度解析-形象比喻系统理解-优雅草卓伊凡
181 0
JAVA高级开发必备·卓伊凡详细JDK、JRE、JVM与Java生态深度解析-形象比喻系统理解-优雅草卓伊凡
|
1月前
|
算法 Java 测试技术
零基础学 Java: 从语法入门到企业级项目实战的详细学习路线解析
本文为零基础学习者提供完整的Java学习路线,涵盖语法基础、面向对象编程、数据结构与算法、多线程、JVM原理、Spring框架、Spring Boot及项目实战,助你从入门到进阶,系统掌握Java编程技能,提升实战开发能力。
104 0

推荐镜像

更多
  • DNS