解析XML文件的几种方法

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: 解析XML文件的几种方法

一、DOM解析


DOM(Document Object  Model)解析是一种基于树结构的解析方法,它将整个XML文件加载到内存中,然后构建一个DOM树,允许开发者通过节点遍历的方式来访问和修改XML文档的内容。DOM解析适合于需要在内存中对XML进行频繁访问和修改的场景。


示例代码:


package cn.juwatech.xmlparse;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;
public class DOMParser {
    public static void main(String[] args) {
        try {
            File xmlFile = new File("example.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(xmlFile);
            doc.getDocumentElement().normalize();
            System.out.println("Root element: " + doc.getDocumentElement().getNodeName());
            NodeList nodeList = doc.getElementsByTagName("book");
            for (int i = 0; i < nodeList.getLength(); i++) {
                Node node = nodeList.item(i);
                if (node.getNodeType() == Node.ELEMENT_NODE) {
                    Element element = (Element) node;
                    System.out.println("Book id: " + element.getAttribute("id"));
                    System.out.println("Title: " + element.getElementsByTagName("title").item(0).getTextContent());
                    System.out.println("Author: " + element.getElementsByTagName("author").item(0).getTextContent());
                    System.out.println("Genre: " + element.getElementsByTagName("genre").item(0).getTextContent());
                    System.out.println("Price: " + element.getElementsByTagName("price").item(0).getTextContent());
                    System.out.println("Publish Date: " + element.getElementsByTagName("publish_date").item(0).getTextContent());
                    System.out.println("Description: " + element.getElementsByTagName("description").item(0).getTextContent());
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

上面的示例代码演示了如何使用DOM解析XML文件。通过DocumentBuilder和Document类,我们可以加载和解析XML文件,并使用Node、Element等类来访问和操作XML文档的节点和元素。


二、SAX解析


SAX(Simple API for  XML)解析是一种基于事件驱动的解析方法,它顺序读取XML文件,一边读取一边解析,并通过事件处理器(Handler)来处理XML文件中的内容。相比于DOM解析,SAX解析不需要将整个文档加载到内存中,适合处理大型XML文件或者需要快速处理和过滤XML数据的场景。


示例代码:


package cn.juwatech.xmlparse;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
public class SAXParserExample {
    public static void main(String[] args) {
        try {
            File xmlFile = new File("example.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();
            DefaultHandler handler = new DefaultHandler() {
                boolean bTitle = false;
                boolean bAuthor = false;
                boolean bGenre = false;
                boolean bPrice = false;
                boolean bPublishDate = false;
                boolean bDescription = false;
                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
                    if (qName.equalsIgnoreCase("title")) {
                        bTitle = true;
                    } else if (qName.equalsIgnoreCase("author")) {
                        bAuthor = true;
                    } else if (qName.equalsIgnoreCase("genre")) {
                        bGenre = true;
                    } else if (qName.equalsIgnoreCase("price")) {
                        bPrice = true;
                    } else if (qName.equalsIgnoreCase("publish_date")) {
                        bPublishDate = true;
                    } else if (qName.equalsIgnoreCase("description")) {
                        bDescription = true;
                    }
                }
                public void characters(char[] ch, int start, int length) throws SAXException {
                    if (bTitle) {
                        System.out.println("Title: " + new String(ch, start, length));
                        bTitle = false;
                    } else if (bAuthor) {
                        System.out.println("Author: " + new String(ch, start, length));
                        bAuthor = false;
                    } else if (bGenre) {
                        System.out.println("Genre: " + new String(ch, start, length));
                        bGenre = false;
                    } else if (bPrice) {
                        System.out.println("Price: " + new String(ch, start, length));
                        bPrice = false;
                    } else if (bPublishDate) {
                        System.out.println("Publish Date: " + new String(ch, start, length));
                        bPublishDate = false;
                    } else if (bDescription) {
                        System.out.println("Description: " + new String(ch, start, length));
                        bDescription = false;
                    }
                }
            };
            saxParser.parse(xmlFile, handler);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

上面的示例代码演示了如何使用SAX解析XML文件。通过实现DefaultHandler类,并覆盖其方法来处理XML文件中的不同事件,从而读取和处理XML文档中的数据。


三、JAXB解析


JAXB(Java Architecture for XML  Binding)是Java的一种XML绑定技术,它可以将XML文档和Java对象相互转换,使得XML与Java对象之间的映射关系更加方便和直观。JAXB通过注解(Annotation)来定义XML元素和Java类的映射关系,适合于XML和Java对象之间频繁的转换操作。


示例代码:


package cn.juwatech.xmlparse;
import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Unmarshaller;
import java.io.File;
public class JAXBParser {
    public static void main(String[] args) {
        try {
            File xmlFile = new File("example.xml");
            JAXBContext jaxbContext = JAXBContext.newInstance(Bookstore.class);
            Unmarshaller jaxbUnmarshaller = jaxbContext.createUnmarshaller();
            Bookstore bookstore = (Bookstore) jaxbUnmarshaller.unmarshal(xmlFile);
            for (Book book : bookstore.getBooks()) {
                System.out.println("Book Id: " + book.getId());
                System.out.println("Title: " + book.getTitle());
                System.out.println("Author: " + book.getAuthor());
                System.out.println("Genre: " + book.getGenre());
                System.out.println("Price: " + book.getPrice());
                System.out.println("Publish Date: " + book.getPublishDate());
                System.out.println("Description: " + book.getDescription());
            }
        } catch (JAXBException e) {
            e.printStackTrace();
        }
    }
}

在上面的示例代码中,通过JAXBContext和Unmarshaller类,我们可以将XML文件example.xml解析成Bookstore对象,并通过Bookstore对象获取并打印所有书籍的信息。


四、总结


本文介绍了在Java中解析XML文件的三种常用方法:DOM解析、SAX解析和JAXB解析。每种方法都有其独特的优缺点和适用场景。DOM解析适合于需要在内存中对XML进行频繁访问和修改的场景;SAX解析适合于处理大型XML文件或者需要快速处理和过滤XML数据的场景;而JAXB解析则适合于XML与Java对象之间的相互转换操作。

相关文章
|
3天前
|
XML Java 数据库
配置applicationContext.xml文件
配置applicationContext.xml文件
|
3天前
|
XML JavaScript Java
解析XML文件的几种方法
解析XML文件的几种方法
|
2天前
|
XML 缓存 JavaScript
优化Java中的XML解析性能
优化Java中的XML解析性能
|
2天前
|
自然语言处理 算法 安全
解析MD5解密的基本方法
解析MD5解密的基本方法
|
1天前
|
JavaScript
js 获取并解析 url 中参数的三种方法
js 获取并解析 url 中参数的三种方法
6 0
|
2月前
|
XML 数据格式
小米备份descript.xml文件
小米备份descript.xml文件
46 0
|
7天前
|
XML Java 数据格式
java创建xml文件内容
java创建xml文件内容
11 0
|
7天前
|
XML Java 数据格式
java解析xml文件内容
java解析xml文件内容
14 0
|
2月前
|
XML 前端开发 数据格式
BeautifulSoup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据
【5月更文挑战第10天】BeautifulSoup 是 Python 的一个库,用于解析 HTML 和 XML 文件,即使在格式不规范的情况下也能有效工作。通过创建 BeautifulSoup 对象并使用方法如 find_all 和 get,可以方便地提取和查找文档中的信息。以下是一段示例代码,展示如何安装库、解析 HTML 数据以及打印段落、链接和特定类名的元素。BeautifulSoup 还支持更复杂的查询和文档修改功能。
39 1
|
5天前
|
XML 数据格式
XML配置Servlet文件,不使用注解配置路径的方法
XML配置Servlet文件,不使用注解配置路径的方法

推荐镜像

更多