【JAVA XML 探秘】DOM、SAX、StAX：揭秘 Java 中 XML 解析技术的终极指南！-阿里云开发者社区

【JAVA XML 探秘】DOM、SAX、StAX：揭秘 Java 中 XML 解析技术的终极指南！

2024-08-25 861

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【8月更文挑战第25天】本文详细探讨了Java中三种主流的XML解析技术：DOM、SAX与StAX。DOM将XML文档转换为树状结构，便于全方位访问和修改；SAX采取事件驱动模式，适用于大型文件的顺序处理；StAX则兼具DOM和SAX的优点，支持流式处理和随机访问。文中提供了每种技术的示例代码，帮助读者理解如何在实际项目中应用这些解析方法。

XML（Extensible Markup Language，可扩展标记语言）是一种用于存储和传输数据的标准格式。在 Java 中，XML 被广泛应用于配置文件、数据交换、Web 服务等领域。本文将以议论文的形式，详细介绍 Java 中常用的几种 XML 解析技术：DOM、SAX 和 StAX，并通过示例代码展示这些技术的使用方法。

DOM 解析

DOM（Document Object Model，文档对象模型）是一种将 XML 文档转化为树形结构的方法。DOM 解析器一次性读取整个 XML 文档，并将其转化为内存中的对象模型，使得开发者可以方便地访问和修改文档中的任何部分。

示例代码

import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

public class DOMParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();

            System.out.println("Root element: " + doc.getDocumentElement().getNodeName());

            NodeList nList = doc.getElementsByTagName("person");

            for (int temp = 0; temp < nList.getLength(); temp++) {
   
                Node nNode = nList.item(temp);

                System.out.println("\nCurrent Element: " + nNode.getNodeName());

                if (nNode.getNodeType() == Node.ELEMENT_NODE) {
   
                    Element eElement = (Element) nNode;

                    System.out.println("Name: " + eElement.getElementsByTagName("name").item(0).getTextContent());
                    System.out.println("Age: " + eElement.getElementsByTagName("age").item(0).getTextContent());
                    System.out.println("Country: " + eElement.getElementsByTagName("country").item(0).getTextContent());
                }
            }
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

SAX 解析

SAX（Simple API for XML，XML 简单 API）是一种事件驱动型的解析方式。SAX 解析器在读取 XML 文档的过程中触发一系列事件，例如开始文档、开始标签、结束标签等，开发者可以通过实现相应的回调方法来处理这些事件。

示例代码

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class SAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();

            DefaultHandler handler = new DefaultHandler() {
   
                boolean bName = false;
                boolean bAge = false;
                boolean bCountry = false;

                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = true;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = true;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = true;
                    }
                }

                public void endElement(String uri, String localName, String qName) throws SAXException {
   
                    if (qName.equalsIgnoreCase("name")) {
   
                        bName = false;
                    } else if (qName.equalsIgnoreCase("age")) {
   
                        bAge = false;
                    } else if (qName.equalsIgnoreCase("country")) {
   
                        bCountry = false;
                    }
                }

                public void characters(char ch[], int start, int length) throws SAXException {
   
                    if (bName) {
   
                        System.out.println("Name: " + new String(ch, start, length));
                    } else if (bAge) {
   
                        System.out.println("Age: " + new String(ch, start, length));
                    } else if (bCountry) {
   
                        System.out.println("Country: " + new String(ch, start, length));
                    }
                }
            };

            saxParser.parse(inputFile, handler);
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

StAX 解析

StAX（Streaming API for XML，流式 XML API）是一种流式解析方式，它结合了 DOM 和 SAX 的优点。StAX 解析器可以逐个事件地读取 XML 文档，这使得它可以处理非常大的 XML 文件，而且不需要一次性加载整个文档到内存中。

示例代码

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamReader;
import java.io.File;
import java.io.FileInputStream;

public class StAXParserExample {
   
    public static void main(String[] args) {
   
        try {
   
            File inputFile = new File("src/main/resources/data.xml");
            FileInputStream fis = new FileInputStream(inputFile);
            XMLInputFactory factory = XMLInputFactory.newInstance();
            XMLStreamReader reader = factory.createXMLStreamReader(fis);

            while (reader.hasNext()) {
   
                int event = reader.next();

                switch (event) {
   
                    case XMLStreamConstants.START_ELEMENT:
                        if ("person".equals(reader.getLocalName())) {
   
                            System.out.println("\nCurrent Element: " + reader.getLocalName());
                        }
                        break;
                    case XMLStreamConstants.CHARACTERS:
                        if ("name".equals(reader.getLocalName())) {
   
                            System.out.println("Name: " + reader.getText());
                        } else if ("age".equals(reader.getLocalName())) {
   
                            System.out.println("Age: " + reader.getText());
                        } else if ("country".equals(reader.getLocalName())) {
   
                            System.out.println("Country: " + reader.getText());
                        }
                        break;
                    case XMLStreamConstants.END_ELEMENT:
                        break;
                }
            }

            reader.close();
        } catch (Exception e) {
   
            e.printStackTrace();
        }
    }
}

讨论

每种解析方式都有其适用场景：

DOM：适用于需要随机访问文档内容的情况。由于需要一次性加载整个文档到内存中，因此不适合处理大型文件。
SAX：适用于只需要顺序读取文档的部分内容的情况。由于采用事件驱动的方式，因此适合处理大型文件，但不能随机访问文档内容。
StAX：结合了 DOM 和 SAX 的优点，既可以处理大型文件，又允许随机访问文档内容。

总结

通过上述议论文，我们可以了解到 Java 中 XML 解析的三种主要技术：DOM、SAX 和 StAX。每种技术都有其独特的优势和适用场景。无论是在日常开发还是面试准备中，熟悉这些 XML 解析技术都是非常重要的。

【JAVA XML 探秘】DOM、SAX、StAX：揭秘 Java 中 XML 解析技术的终极指南！

DOM 解析

示例代码

SAX 解析

示例代码

StAX 解析

示例代码

讨论

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【JAVA XML 探秘】DOM、SAX、StAX：揭秘 Java 中 XML 解析技术的终极指南！

DOM 解析

示例代码

SAX 解析

示例代码

StAX 解析

示例代码

讨论

总结

热门文章

最新文章

相关课程

相关电子书

推荐镜像