Java通过XML Schema校验XML

简介:
XML的校验在XML处理中非常常见,如果没有有效的办法来校验XML的合法性,往往会导致很多问题。
 
XML的校验是通过XML Schema(XSD) 或DTD文件的语法规范来校验的。DTD现在越来越不受欢迎了,在此选用XSD来校验。
 
Java校验XML是件和扯淡的事情,因为Sun的XML相关软件包会令你云里雾里。
W3C这块的XML相关的规范相当的多,这也是导致XML处理器起来费劲的主要原因。要想精通这些规范和相关的API,实在是异想天开(新的规范在不停出,越来越多!)。
 
校验的原理是通过读取解析XML的时候设置校验的XSD和校验错误处理器,顺便校验的。
 
下面不扯这些废话了,我用DOM4j结合javaxml api使用XSD来校验一个xml有效性,下面这个例子虽然和蹩脚,但是也费了一番功夫,放出来大家研究吧,有更好的实现也希望能和我一同分享。
 
例子如下:
 
XML文件
<? xml  version ="1.0" ?> 
< note 
         xmlns ="http://www.w3school.com.cn" 
         xmlns:xsi ="http://www.w3.org/2001/XMLSchema-instance" 
         xsi:schemaLocation ="http://www.w3school.com.cn file:///D:/_dev_stu/xsdtest/src/note.xml" > 

     < to >George </ to > 
     < from >John </ from > 
     < heading >Reminder </ heading > 
     < body >Don't forget the meeting this weekend! </ body > 
</ note >
 
XSD文件
<? xml  version ="1.0" ?> 
< xs:schema  xmlns:xs ="http://www.w3.org/2001/XMLSchema" 
            targetNamespace ="http://www.w3school.com.cn" 
            xmlns ="http://www.w3school.com.cn" 
            elementFormDefault ="qualified" > 

     < xs:element  name ="note" > 
         < xs:complexType > 
             < xs:sequence > 
                 < xs:element  name ="to"  type ="xs:string" /> 
                 < xs:element  name ="from"  type ="xs:string" /> 
                 < xs:element  name ="heading"  type ="xs:string" /> 
                 < xs:element  name ="body"  type ="xs:string" /> 
             </ xs:sequence > 
         </ xs:complexType > 
     </ xs:element > 

</ xs:schema >
 
测试代码
import org.dom4j.Document; 
import org.dom4j.io.OutputFormat; 
import org.dom4j.io.SAXReader; 
import org.dom4j.io.SAXValidator; 
import org.dom4j.io.XMLWriter; 
import org.dom4j.util.XMLErrorHandler; 

import javax.xml.parsers.SAXParser; 
import javax.xml.parsers.SAXParserFactory; 
import java.io.File; 

/** 
* Java XML校验测试 

* @author leizhimin,2008-9-4 14:42:35 
*/
 
public  class ValidataXMLTest { 
     public  static  void main(String[] args) { 
        validateXMLByXSD(); 
        validateXMLByDTD(); 

    } 

     /** 
     * 通过XSD(XML Schema)校验XML 
     */
 
     public  static  void validateXMLByXSD() { 
        String xmlFileName =  "Q:\\_dev_stu\\xsdtest\\src\\note.xml"
        String xsdFileName =  "Q:\\_dev_stu\\xsdtest\\src\\note.xsd"
         try { 
             //创建默认的XML错误处理器 
            XMLErrorHandler errorHandler =  new XMLErrorHandler(); 
             //获取基于 SAX 的解析器的实例 
            SAXParserFactory factory = SAXParserFactory.newInstance(); 
             //解析器在解析时验证 XML 内容。 
            factory.setValidating( true); 
             //指定由此代码生成的解析器将提供对 XML 名称空间的支持。 
            factory.setNamespaceAware( true); 
             //使用当前配置的工厂参数创建 SAXParser 的一个新实例。 
            SAXParser parser = factory.newSAXParser(); 
             //创建一个读取工具 
            SAXReader xmlReader =  new SAXReader(); 
             //获取要校验xml文档实例 
            Document xmlDocument = (Document) xmlReader.read( new File(xmlFileName)); 
             //设置 XMLReader 的基础实现中的特定属性。核心功能和属性列表可以在 [url]http://sax.sourceforge.net/?selected=get-set[/url] 中找到。 
            parser.setProperty( 
                     "http://java.sun.com/xml/jaxp/properties/schemaLanguage", 
                    "http://www.w3.org/2001/XMLSchema"); 
            parser.setProperty( 
                    "http://java.sun.com/xml/jaxp/properties/schemaSource", 
                    "file:" + xsdFileName); 
            //创建一个SAXValidator校验工具,并设置校验工具的属性 
            SAXValidator validator = new SAXValidator(parser.getXMLReader()); 
            //设置校验工具的错误处理器,当发生错误时,可以从处理器对象中得到错误信息。 
            validator.setErrorHandler(errorHandler); 
            //校验 
            validator.validate(xmlDocument); 

            XMLWriter writer = new XMLWriter(OutputFormat.createPrettyPrint()); 
            //如果错误信息不为空,说明校验失败,打印错误信息 
            if (errorHandler.getErrors().hasContent()) { 
                System.out.println("XML文件通过XSD文件校验失败!"); 
                writer.write(errorHandler.getErrors()); 
            } else { 
                System.out.println("Good! XML文件通过XSD文件校验成功!"); 
            } 
        } catch (Exception ex) { 
            System.out.println("XML文件: " + xmlFileName + " 通过XSD文件:" + xsdFileName + "检验失败。\n原因: "+ ex.getMessage()); 
            ex.printStackTrace(); 
        } 
    } 

    /** 
     * 通过DTD校验XML 
     */
 
    public static void validateXMLByDTD() { 
        //todo:暂时不用,以后再说吧 
    } 
}
 
运行结果
Good! XML文件通过XSD文件校验成功!
 


本文转自 leizhimin 51CTO博客,原文链接:http://blog.51cto.com/lavasoft/97597,如需转载请自行联系原作者
相关文章
|
3月前
|
XML 数据采集 存储
使用Java和XPath在XML文档中精准定位数据
在数据驱动的时代,从复杂结构中精确提取信息至关重要。XML被广泛用于数据存储与传输,而XPath则能高效地在这些文档中导航和提取数据。本文深入探讨如何使用Java和XPath精准定位XML文档中的数据,并通过小红书的实际案例进行分析。首先介绍了XML及其挑战,接着阐述了XPath的优势。然后,提出从大型XML文档中自动提取特定产品信息的需求,并通过代理IP技术、设置Cookie和User-Agent以及多线程技术来解决实际网络环境下的数据抓取问题。最后,提供了一个Java示例代码,演示如何集成这些技术以高效地从XML源中抓取数据。
使用Java和XPath在XML文档中精准定位数据
|
3月前
|
XML JavaScript Java
【JAVA XML 探秘】DOM、SAX、StAX:揭秘 Java 中 XML 解析技术的终极指南!
【8月更文挑战第25天】本文详细探讨了Java中三种主流的XML解析技术:DOM、SAX与StAX。DOM将XML文档转换为树状结构,便于全方位访问和修改;SAX采取事件驱动模式,适用于大型文件的顺序处理;StAX则兼具DOM和SAX的优点,支持流式处理和随机访问。文中提供了每种技术的示例代码,帮助读者理解如何在实际项目中应用这些解析方法。
141 1
|
28天前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
61 4
|
29天前
|
XML JavaScript Java
java与XML文件的读写
java与XML文件的读写
21 3
|
3月前
|
XML 存储 JavaScript
在 Java 中如何将 ArrayList 转换为 XML
【8月更文挑战第23天】
24 3
|
3月前
|
C# 前端开发 UED
WPF数据验证实战:内置控件与自定义规则,带你玩转前端数据验证,让你的应用程序更上一层楼!
【8月更文挑战第31天】在WPF应用开发中,数据验证是确保输入正确性的关键环节。前端验证能及时发现错误,提升用户体验和程序可靠性。本文对比了几种常用的WPF数据验证方法,并通过示例展示了如何使用内置验证控件(如`TextBox`)及自定义验证规则实现有效验证。内置控件结合`Validation`类可快速实现简单验证;自定义规则则提供了更灵活的复杂逻辑支持。希望本文能帮助开发者更好地进行WPF数据验证。
94 0
|
3月前
|
XML 自然语言处理 Java
Java 中的 XML 数据绑定
【8月更文挑战第22天】
23 0
|
3月前
|
XML 数据格式
DTD和XML Schema之间的区别?
【8月更文挑战第22天】
60 0
|
4月前
|
XML Java 数据库连接
【项目问题解决】 java.lang.IllegalArgumentException: XML fragments parsed
**问题摘要:** Java 应用在执行MyBatis映射时抛出`IllegalArgumentException`,指出XML片段缺少`com.xxx.xxx.xxx.xxx.dao.SingleApasInfoDao.selectListCondition`的值。此异常暗示XML映射文件存在错误或未定义指定方法。解决策略包括检查映射文件中标签的完整性与属性设置,修复可能的XML格式错误,以及确保使用的XML解析器支持所需特性,如有必要,升级解析器。
138 1
|
4月前
|
XML 缓存 JavaScript
优化Java中的XML解析性能
优化Java中的XML解析性能