【JAVA XML 探秘】DOM、SAX、StAX:揭秘 Java 中 XML 解析技术的终极指南!

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 【8月更文挑战第25天】本文详细探讨了Java中三种主流的XML解析技术:DOM、SAX与StAX。DOM将XML文档转换为树状结构,便于全方位访问和修改;SAX采取事件驱动模式,适用于大型文件的顺序处理;StAX则兼具DOM和SAX的优点,支持流式处理和随机访问。文中提供了每种技术的示例代码,帮助读者理解如何在实际项目中应用这些解析方法。

XML(Extensible Markup Language,可扩展标记语言)是一种用于存储和传输数据的标准格式。在 Java 中,XML 被广泛应用于配置文件、数据交换、Web 服务等领域。本文将以议论文的形式,详细介绍 Java 中常用的几种 XML 解析技术:DOM、SAX 和 StAX,并通过示例代码展示这些技术的使用方法。

DOM 解析

DOM(Document Object Model,文档对象模型)是一种将 XML 文档转化为树形结构的方法。DOM 解析器一次性读取整个 XML 文档,并将其转化为内存中的对象模型,使得开发者可以方便地访问和修改文档中的任何部分。

示例代码

import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

public class DOMParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();

            System.out.println("Root element: " + doc.getDocumentElement().getNodeName());

            NodeList nList = doc.getElementsByTagName("person");

            for (int temp = 0; temp < nList.getLength(); temp++) {
   
                Node nNode = nList.item(temp);

                System.out.println("\nCurrent Element: " + nNode.getNodeName());

                if (nNode.getNodeType() == Node.ELEMENT_NODE) {
   
                    Element eElement = (Element) nNode;

                    System.out.println("Name: " + eElement.getElementsByTagName("name").item(0).getTextContent());
                    System.out.println("Age: " + eElement.getElementsByTagName("age").item(0).getTextContent());
                    System.out.println("Country: " + eElement.getElementsByTagName("country").item(0).getTextContent());
                }
            }
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

SAX 解析

SAX(Simple API for XML,XML 简单 API)是一种事件驱动型的解析方式。SAX 解析器在读取 XML 文档的过程中触发一系列事件,例如开始文档、开始标签、结束标签等,开发者可以通过实现相应的回调方法来处理这些事件。

示例代码

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class SAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();

            DefaultHandler handler = new DefaultHandler() {
   
                boolean bName = false;
                boolean bAge = false;
                boolean bCountry = false;

                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = true;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = true;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = true;
                    }
                }

                public void endElement(String uri, String localName, String qName) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = false;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = false;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = false;
                    }
                }

                public void characters(char ch[], int start, int length) throws SAXException {
   
                    if (bName) {
   
                        System.out.println("Name: " + new String(ch, start, length));
                    } else if (bAge) {
   
                        System.out.println("Age: " + new String(ch, start, length));
                    } else if (bCountry) {
   
                        System.out.println("Country: " + new String(ch, start, length));
                    }
                }
            };

            saxParser.parse(inputFile, handler);
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

StAX 解析

StAX(Streaming API for XML,流式 XML API)是一种流式解析方式,它结合了 DOM 和 SAX 的优点。StAX 解析器可以逐个事件地读取 XML 文档,这使得它可以处理非常大的 XML 文件,而且不需要一次性加载整个文档到内存中。

示例代码

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamReader;
import java.io.File;
import java.io.FileInputStream;

public class StAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            FileInputStream fis = new FileInputStream(inputFile);
            XMLInputFactory factory = XMLInputFactory.newInstance();
            XMLStreamReader reader = factory.createXMLStreamReader(fis);

            while (reader.hasNext()) {
   
                int event = reader.next();

                switch (event) {
   
                    case XMLStreamConstants.START_ELEMENT:
                        if ("person".equals(reader.getLocalName())) {
   
                            System.out.println("\nCurrent Element: " + reader.getLocalName());
                        }
                        break;
                    case XMLStreamConstants.CHARACTERS:
                        if ("name".equals(reader.getLocalName())) {
   
                            System.out.println("Name: " + reader.getText());
                        } else if ("age".equals(reader.getLocalName())) {
   
                            System.out.println("Age: " + reader.getText());
                        } else if ("country".equals(reader.getLocalName())) {
   
                            System.out.println("Country: " + reader.getText());
                        }
                        break;
                    case XMLStreamConstants.END_ELEMENT:
                        break;
                }
            }

            reader.close();
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

讨论

每种解析方式都有其适用场景:

  • DOM:适用于需要随机访问文档内容的情况。由于需要一次性加载整个文档到内存中,因此不适合处理大型文件。
  • SAX:适用于只需要顺序读取文档的部分内容的情况。由于采用事件驱动的方式,因此适合处理大型文件,但不能随机访问文档内容。
  • StAX:结合了 DOM 和 SAX 的优点,既可以处理大型文件,又允许随机访问文档内容。

总结

通过上述议论文,我们可以了解到 Java 中 XML 解析的三种主要技术:DOM、SAX 和 StAX。每种技术都有其独特的优势和适用场景。无论是在日常开发还是面试准备中,熟悉这些 XML 解析技术都是非常重要的。

相关文章
|
11天前
|
存储 Java 计算机视觉
Java二维数组的使用技巧与实例解析
本文详细介绍了Java中二维数组的使用方法
28 15
|
11天前
|
算法 搜索推荐 Java
【潜意识Java】深度解析黑马项目《苍穹外卖》与蓝桥杯算法的结合问题
本文探讨了如何将算法学习与实际项目相结合,以提升编程竞赛中的解题能力。通过《苍穹外卖》项目,介绍了订单配送路径规划(基于动态规划解决旅行商问题)和商品推荐系统(基于贪心算法)。这些实例不仅展示了算法在实际业务中的应用,还帮助读者更好地准备蓝桥杯等编程竞赛。结合具体代码实现和解析,文章详细说明了如何运用算法优化项目功能,提高解决问题的能力。
44 6
|
11天前
|
存储 算法 搜索推荐
【潜意识Java】期末考试可能考的高质量大题及答案解析
Java 期末考试大题整理:设计一个学生信息管理系统,涵盖面向对象编程、集合类、文件操作、异常处理和多线程等知识点。系统功能包括添加、查询、删除、显示所有学生信息、按成绩排序及文件存储。通过本题,考生可以巩固 Java 基础知识并掌握综合应用技能。代码解析详细,适合复习备考。
16 4
|
11天前
|
Java 编译器 程序员
【潜意识Java】期末考试可能考的简答题及答案解析
为了帮助同学们更好地准备 Java 期末考试,本文列举了一些常见的简答题,并附上详细的答案解析。内容包括类与对象的区别、多态的实现、异常处理、接口与抽象类的区别以及垃圾回收机制。通过这些题目,同学们可以深入理解 Java 的核心概念,从而在考试中更加得心应手。每道题都配有代码示例和详细解释,帮助大家巩固知识点。希望这些内容能助力大家顺利通过考试!
11 0
|
3月前
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
106 1
|
5月前
|
XML Java 数据格式
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
这篇文章是Spring5框架的实战教程,主要介绍了如何在Spring的IOC容器中通过XML配置方式使用外部属性文件来管理Bean,特别是数据库连接池的配置。文章详细讲解了创建属性文件、引入属性文件到Spring配置、以及如何使用属性占位符来引用属性文件中的值。
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
|
2月前
|
XML Android开发 数据格式
Eclipse 创建 XML 文件
Eclipse 创建 XML 文件
45 2
|
2月前
|
Java Maven
maven项目的pom.xml文件常用标签使用介绍
第四届人文,智慧教育与服务管理国际学术会议(HWESM 2025) 2025 4th International Conference on Humanities, Wisdom Education and Service Management
262 8
|
7月前
|
XML Java 数据格式
java创建xml文件内容
java创建xml文件内容
|
3月前
|
XML JavaScript Java
java与XML文件的读写
java与XML文件的读写
43 3

推荐镜像

更多