dom4j解析xml实战

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
简介: dom4j解析xml实战

前言


最近有个同事说一个xml解析,说是很复杂。然后让我给看看。我给解析完了。现在分享下,希望如果遇到同样问题的朋友随时可以借鉴参考。


所谓的复杂xml


<?xml version="1.0" encoding="UTF-8"?>
<getOutptTplAsnResponse xmlns="http://tempuri.org/">
    <getOutptTplAsnResult>
        <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns=""
                   xmlns:msdata="urn:schemas-microsoft-com:xml-msdata" id="NewDataSet">
            <xs:element name="NewDataSet" msdata:IsDataSet="true" msdata:UseCurrentLocale="true">
                <xs:complexType>
                    <xs:choice minOccurs="0" maxOccurs="unbounded">
                        <xs:element name="ds">
                            <xs:complexType>
                                <xs:sequence>
                                    <xs:element name="SHPMT_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="TO_WHSE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_NBR_DTL" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SEASON" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SIZE_DESC" type="xs:string" minOccurs="0"/>
                                    <xs:element name="REC_QTY" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="BATCH_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="MFG_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="XPIRE_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="INV_LOCK" type="xs:string" minOccurs="0"/>
                                    <xs:element name="PROC_STAT_CODE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CREATE_DATE_TIME" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="USER_ID" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SKU_ATTR_1" type="xs:string" minOccurs="0"/>
                                    <xs:element name="ASN_ORGN_TYPE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="OUT_NBR" type="xs:string" minOccurs="0"/>
                                    <xs:element name="UNITS_RCVD" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARRIER_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="TO_DATE" type="xs:dateTime" minOccurs="0"/>
                                    <xs:element name="CARRIER_COMPANY" type="xs:string" minOccurs="0"/>
                                    <xs:element name="CARRIER_CITY" type="xs:string" minOccurs="0"/>
                                    <xs:element name="MAX_DATE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARRIER_TYPE" type="xs:string" minOccurs="0"/>
                                    <xs:element name="CASE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="UNITS" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="TEMPERATURE" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="TEMP_OUT" type="xs:string" minOccurs="0"/>
                                    <xs:element name="COLD_CARRIER" type="xs:string" minOccurs="0"/>
                                    <xs:element name="SAMP_CASES" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="SAMP_UNITS" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="OUTPT_ASN_ID" type="xs:decimal" minOccurs="0"/>
                                    <xs:element name="CARTON_TYPE" type="xs:string" minOccurs="0"/>
                                </xs:sequence>
                            </xs:complexType>
                        </xs:element>
                    </xs:choice>
                </xs:complexType>
            </xs:element>
        </xs:schema>
        <diffgr:diffgram xmlns:diffgr="urn:schemas-microsoft-com:xml-diffgram-v1"
                         xmlns:msdata="urn:schemas-microsoft-com:xml-msdata">
            <NewDataSet xmlns="">
                <ds diffgr:id="ds1" msdata:rowOrder="0">
                    <SHPMT_NBR>000009459</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR_DTL>000009459</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>000008</SIZE_DESC>
                    <REC_QTY>5</REC_QTY>
                    <BATCH_NBR>20210824</BATCH_NBR>
                    <MFG_DATE>2021-02-01T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-02-02T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2021-08-24T16:12:01+08:00</CREATE_DATE_TIME>
                    <USER_ID>xxx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>5</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>20500</OUTPT_ASN_ID>
                </ds>
                <ds diffgr:id="ds2" msdata:rowOrder="1">
                    <SHPMT_NBR>CSP0058229</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR>JD-2022-05-24-0003</ASN_NBR>
                    <ASN_NBR_DTL>620</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>020100003</SIZE_DESC>
                    <REC_QTY>8</REC_QTY>
                    <BATCH_NBR>2022-403</BATCH_NBR>
                    <MFG_DATE>2021-02-01T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-03-03T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2022-05-24T10:35:15+08:00</CREATE_DATE_TIME>
                    <USER_ID>xx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>10</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>26174</OUTPT_ASN_ID>
                </ds>
                <ds diffgr:id="ds3" msdata:rowOrder="2">
                    <SHPMT_NBR>CSP0058229</SHPMT_NBR>
                    <TO_WHSE>SY1</TO_WHSE>
                    <ASN_NBR>JD-2022-05-24-0003</ASN_NBR>
                    <ASN_NBR_DTL>620</ASN_NBR_DTL>
                    <SEASON>CS</SEASON>
                    <SIZE_DESC>020100003</SIZE_DESC>
                    <REC_QTY>2</REC_QTY>
                    <BATCH_NBR>20323-1</BATCH_NBR>
                    <MFG_DATE>2021-02-03T00:00:00+08:00</MFG_DATE>
                    <XPIRE_DATE>2029-04-02T00:00:00+08:00</XPIRE_DATE>
                    <INV_LOCK>1</INV_LOCK>
                    <PROC_STAT_CODE>0</PROC_STAT_CODE>
                    <CREATE_DATE_TIME>2022-05-24T10:35:15+08:00</CREATE_DATE_TIME>
                    <USER_ID>xxxxx</USER_ID>
                    <ASN_ORGN_TYPE>P</ASN_ORGN_TYPE>
                    <UNITS_RCVD>10</UNITS_RCVD>
                    <MAX_DATE>0</MAX_DATE>
                    <CASE>0</CASE>
                    <UNITS>0</UNITS>
                    <TEMPERATURE>0</TEMPERATURE>
                    <SAMP_CASES>0</SAMP_CASES>
                    <SAMP_UNITS>0</SAMP_UNITS>
                    <OUTPT_ASN_ID>26175</OUTPT_ASN_ID>
                </ds>
            </NewDataSet>
        </diffgr:diffgram>
    </getOutptTplAsnResult>
</getOutptTplAsnResponse>


解析思路


使用dom4j技术,以 >为标示符,进行分割,获取到想要获取数据的上一层,然后通过getElement获取一个元素或者getElements获取一组相同标签数据。


解析实战


1.第一步引入 dom4j


<dependency>
    <groupId>org.dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>2.1.3</version>
</dependency>


2.引入我的xml解析工具类


import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.XMLWriter;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.List;
/**
 * Dom4j读取Element
 *
 * @author hfl
 */
public class XmlUtil {
    private static Logger logger = LoggerFactory.getLogger(XmlUtil.class.getName());
    public static List<Element> getElements(Document document, String path) {
        return getElement(document, path).elements();
    }
    public static Element getElement(Document document, String path) {
        String[] paths = path.split(">");
        Element result = document.getRootElement();
        for (String item : paths) {
            try {
                result = result.element(item);
            } catch (Exception e) {
                logger.error("get element error: ", e);
            }
        }
        return result;
    }
    public static String getValue(Document document, String path) {
        String[] paths = path.split(">");
        Element result = document.getRootElement();
        for (String item : paths) {
            try {
                result = result.element(item);
            } catch (Exception e) {
                logger.error("get element error: ", e);
            }
        }
        return result.getText();
    }
    public static Document create() {
        // 创建一个xml文档
        Document doc = DocumentHelper.createDocument();
        Element university = doc.addElement("university");
        university.addAttribute("name", "tsu");
        // 注释
        university.addComment("这个是根节点");
        Element college = university.addElement("college");
        college.addAttribute("name", "cccccc");
        college.setText("text");
        return doc;
    }
    public static void write(Document doc) {
        try {
            File file = new File("src/dom4j-modify.xml");
            if (file.exists()) {
                file.delete();
            }
            file.createNewFile();
            XMLWriter out = new XMLWriter(new FileWriter(file));
            out.write(doc);
            out.flush();
            out.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}


3.开始解析测试类


@Slf4j
public class DomTest {
    @Test
    public void xmlToList() throws Exception {
        String path = "D:\\comp\\springboot2\\02\\vehicle-business\\vehicle-business-service\\src\\test\\java\\com\\wuzheng\\vehicle\\business\\domtest\\xmltest.xml";
        Document dom = new SAXReader().read(new File(path));
        List<Element> elist = XmlUtil.getElements(dom, "getOutptTplAsnResult>diffgram>NewDataSet");
        for (Element element : elist) {
            log.info("recordlist ----------------");
            Map<String, String> map = element.elements().stream().collect(Collectors.toMap(Element::getName, Element::getTextTrim));
            log.info("recordlist = {}", new Gson().toJson(map));
        }
    }
}


4.查看效果:


1dc618a0ed9580ce8bfa6facb208c08f.png

3条全部解析完毕!!!


大功告成!!



相关文章
|
4天前
|
XML Web App开发 JavaScript
XML DOM 解析器
**XML DOM解析器将XML转换为JavaScript对象,允许在浏览器中操作XML。浏览器通常内置XML解析器,如XMLHttpRequest用于加载XML文档。以下代码示例展示如何加载&quot;books.xml&quot;:** ```markdown - 创建XMLHttpRequest对象(或使用ActiveXObject for IE6/IE5) - 打开GET请求到&quot;books.xml&quot; - 发送请求 - xmlDoc变量存储响应的XML DOM ``` 此过程使开发者能够通过JavaScript遍历、修改XML文档的结构。
|
10天前
|
XML Java 数据格式
必知的技术知识:java基础73dom4j修改xml里面的内容(网页知识)
必知的技术知识:java基础73dom4j修改xml里面的内容(网页知识)
11 1
|
9天前
|
XML Web App开发 JavaScript
XML DOM 解析器
**XML DOM解析器**是浏览器内置的工具,用于将XML转换为JavaScript对象,便于操作。通过XMLHttpRequest或ActiveXObject加载XML文档,如`books.xml`,创建HTTP请求并获取响应后,将XML转换为`responseXML`,形成DOM树,允许开发者遍历、修改节点。
|
4天前
|
存储 数据管理 数据库
CRUD操作实战:从理论到代码实现的全面解析
【7月更文挑战第4天】在软件开发领域,CRUD代表了数据管理的四个基本操作:创建(Create)、读取(Read)、更新(Update)和删除(Delete)。这四个操作构成了大多数应用程序数据交互的核心。本文将深入讲解CRUD概念,并通过一个简单的代码示例,展示如何在实际项目中实现这些操作。我们将使用Python语言结合SQLite数据库来演示,因为它们的轻量级特性和易用性非常适合教学目的。
33 2
|
9天前
|
XML JavaScript Java
解析XML文件的几种方法
解析XML文件的几种方法
|
7天前
|
XML 缓存 JavaScript
优化Java中的XML解析性能
优化Java中的XML解析性能
|
9天前
|
XML Web App开发 JavaScript
XML DOM 解析器
**XML DOM解析器**是浏览器内置的工具,用于将XML转换为JavaScript对象,便于操作。通过XMLHttpRequest加载XML文档,如`books.xml`,创建HTTP请求并获取响应后,将XML响应转换为DOM对象,赋值给`xmlDoc`,允许使用JS遍历和修改XML结构。在不同浏览器中,可能使用XMLHttpRequest或ActiveXObject。
|
10天前
|
Java 开发者 Spring
深入解析 @Transactional:Spring 事务管理的艺术及实战应对策略
深入解析 @Transactional:Spring 事务管理的艺术及实战应对策略
15 2
|
3天前
|
传感器 编解码 API
【STM32开发入门】温湿度监测系统实战:SPI LCD显示、HAL库应用、GPIO配置、UART中断接收、ADC采集与串口通信全解析
SPI(Serial Peripheral Interface)是一种同步串行通信接口,常用于微控制器与外围设备间的数据传输。SPI LCD是指使用SPI接口与微控制器通信的液晶显示屏。这类LCD通常具有较少的引脚(通常4个:MISO、MOSI、SCK和SS),因此在引脚资源有限的系统中非常有用。通过SPI协议,微控制器可以向LCD发送命令和数据,控制显示内容和模式。
|
6天前
|
XML Web App开发 JavaScript
XML DOM 解析器
**XML DOM解析器将XML转换为JavaScript对象,允许遍历、访问和修改文档。浏览器内置XML解析器,如XMLHttpRequest用于加载XML文档。

推荐镜像

更多