XML的校验在XML处理中非常常见,如果没有有效的办法来校验XML的合法性,往往会导致很多问题。
XML的校验是通过XML Schema(XSD) 或DTD文件的语法规范来校验的。DTD现在越来越不受欢迎了,在此选用XSD来校验。
Java校验XML是件和扯淡的事情,因为Sun的XML相关软件包会令你云里雾里。
W3C这块的XML相关的规范相当的多,这也是导致XML处理器起来费劲的主要原因。要想精通这些规范和相关的API,实在是异想天开(新的规范在不停出,越来越多!)。
校验的原理是通过读取解析XML的时候设置校验的XSD和校验错误处理器,顺便校验的。
下面不扯这些废话了,我用DOM4j结合javaxml api使用XSD来校验一个xml有效性,下面这个例子虽然和蹩脚,但是也费了一番功夫,放出来大家研究吧,有更好的实现也希望能和我一同分享。
例子如下:
XML文件
<?
xml
version
="1.0"
?>
< note
xmlns ="http://www.w3school.com.cn"
xmlns:xsi ="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation ="http://www.w3school.com.cn file:///D:/_dev_stu/xsdtest/src/note.xml" >
< to >George </ to >
< from >John </ from >
< heading >Reminder </ heading >
< body >Don't forget the meeting this weekend! </ body >
</ note >
< note
xmlns ="http://www.w3school.com.cn"
xmlns:xsi ="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation ="http://www.w3school.com.cn file:///D:/_dev_stu/xsdtest/src/note.xml" >
< to >George </ to >
< from >John </ from >
< heading >Reminder </ heading >
< body >Don't forget the meeting this weekend! </ body >
</ note >
XSD文件
<?
xml
version
="1.0"
?>
< xs:schema xmlns:xs ="http://www.w3.org/2001/XMLSchema"
targetNamespace ="http://www.w3school.com.cn"
xmlns ="http://www.w3school.com.cn"
elementFormDefault ="qualified" >
< xs:element name ="note" >
< xs:complexType >
< xs:sequence >
< xs:element name ="to" type ="xs:string" />
< xs:element name ="from" type ="xs:string" />
< xs:element name ="heading" type ="xs:string" />
< xs:element name ="body" type ="xs:string" />
</ xs:sequence >
</ xs:complexType >
</ xs:element >
</ xs:schema >
< xs:schema xmlns:xs ="http://www.w3.org/2001/XMLSchema"
targetNamespace ="http://www.w3school.com.cn"
xmlns ="http://www.w3school.com.cn"
elementFormDefault ="qualified" >
< xs:element name ="note" >
< xs:complexType >
< xs:sequence >
< xs:element name ="to" type ="xs:string" />
< xs:element name ="from" type ="xs:string" />
< xs:element name ="heading" type ="xs:string" />
< xs:element name ="body" type ="xs:string" />
</ xs:sequence >
</ xs:complexType >
</ xs:element >
</ xs:schema >
测试代码
import org.dom4j.Document;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.SAXValidator;
import org.dom4j.io.XMLWriter;
import org.dom4j.util.XMLErrorHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
/**
* Java XML校验测试
*
* @author leizhimin,2008-9-4 14:42:35
*/
public class ValidataXMLTest {
public static void main(String[] args) {
validateXMLByXSD();
validateXMLByDTD();
}
/**
* 通过XSD(XML Schema)校验XML
*/
public static void validateXMLByXSD() {
String xmlFileName = "Q:\\_dev_stu\\xsdtest\\src\\note.xml";
String xsdFileName = "Q:\\_dev_stu\\xsdtest\\src\\note.xsd";
try {
//创建默认的XML错误处理器
XMLErrorHandler errorHandler = new XMLErrorHandler();
//获取基于 SAX 的解析器的实例
SAXParserFactory factory = SAXParserFactory.newInstance();
//解析器在解析时验证 XML 内容。
factory.setValidating( true);
//指定由此代码生成的解析器将提供对 XML 名称空间的支持。
factory.setNamespaceAware( true);
//使用当前配置的工厂参数创建 SAXParser 的一个新实例。
SAXParser parser = factory.newSAXParser();
//创建一个读取工具
SAXReader xmlReader = new SAXReader();
//获取要校验xml文档实例
Document xmlDocument = (Document) xmlReader.read( new File(xmlFileName));
//设置 XMLReader 的基础实现中的特定属性。核心功能和属性列表可以在 [url]http://sax.sourceforge.net/?selected=get-set[/url] 中找到。
parser.setProperty(
"http://java.sun.com/xml/jaxp/properties/schemaLanguage",
"http://www.w3.org/2001/XMLSchema");
parser.setProperty(
"http://java.sun.com/xml/jaxp/properties/schemaSource",
"file:" + xsdFileName);
//创建一个SAXValidator校验工具,并设置校验工具的属性
SAXValidator validator = new SAXValidator(parser.getXMLReader());
//设置校验工具的错误处理器,当发生错误时,可以从处理器对象中得到错误信息。
validator.setErrorHandler(errorHandler);
//校验
validator.validate(xmlDocument);
XMLWriter writer = new XMLWriter(OutputFormat.createPrettyPrint());
//如果错误信息不为空,说明校验失败,打印错误信息
if (errorHandler.getErrors().hasContent()) {
System.out.println("XML文件通过XSD文件校验失败!");
writer.write(errorHandler.getErrors());
} else {
System.out.println("Good! XML文件通过XSD文件校验成功!");
}
} catch (Exception ex) {
System.out.println("XML文件: " + xmlFileName + " 通过XSD文件:" + xsdFileName + "检验失败。\n原因: "+ ex.getMessage());
ex.printStackTrace();
}
}
/**
* 通过DTD校验XML
*/
public static void validateXMLByDTD() {
//todo:暂时不用,以后再说吧
}
}
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.SAXValidator;
import org.dom4j.io.XMLWriter;
import org.dom4j.util.XMLErrorHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
/**
* Java XML校验测试
*
* @author leizhimin,2008-9-4 14:42:35
*/
public class ValidataXMLTest {
public static void main(String[] args) {
validateXMLByXSD();
validateXMLByDTD();
}
/**
* 通过XSD(XML Schema)校验XML
*/
public static void validateXMLByXSD() {
String xmlFileName = "Q:\\_dev_stu\\xsdtest\\src\\note.xml";
String xsdFileName = "Q:\\_dev_stu\\xsdtest\\src\\note.xsd";
try {
//创建默认的XML错误处理器
XMLErrorHandler errorHandler = new XMLErrorHandler();
//获取基于 SAX 的解析器的实例
SAXParserFactory factory = SAXParserFactory.newInstance();
//解析器在解析时验证 XML 内容。
factory.setValidating( true);
//指定由此代码生成的解析器将提供对 XML 名称空间的支持。
factory.setNamespaceAware( true);
//使用当前配置的工厂参数创建 SAXParser 的一个新实例。
SAXParser parser = factory.newSAXParser();
//创建一个读取工具
SAXReader xmlReader = new SAXReader();
//获取要校验xml文档实例
Document xmlDocument = (Document) xmlReader.read( new File(xmlFileName));
//设置 XMLReader 的基础实现中的特定属性。核心功能和属性列表可以在 [url]http://sax.sourceforge.net/?selected=get-set[/url] 中找到。
parser.setProperty(
"http://java.sun.com/xml/jaxp/properties/schemaLanguage",
"http://www.w3.org/2001/XMLSchema");
parser.setProperty(
"http://java.sun.com/xml/jaxp/properties/schemaSource",
"file:" + xsdFileName);
//创建一个SAXValidator校验工具,并设置校验工具的属性
SAXValidator validator = new SAXValidator(parser.getXMLReader());
//设置校验工具的错误处理器,当发生错误时,可以从处理器对象中得到错误信息。
validator.setErrorHandler(errorHandler);
//校验
validator.validate(xmlDocument);
XMLWriter writer = new XMLWriter(OutputFormat.createPrettyPrint());
//如果错误信息不为空,说明校验失败,打印错误信息
if (errorHandler.getErrors().hasContent()) {
System.out.println("XML文件通过XSD文件校验失败!");
writer.write(errorHandler.getErrors());
} else {
System.out.println("Good! XML文件通过XSD文件校验成功!");
}
} catch (Exception ex) {
System.out.println("XML文件: " + xmlFileName + " 通过XSD文件:" + xsdFileName + "检验失败。\n原因: "+ ex.getMessage());
ex.printStackTrace();
}
}
/**
* 通过DTD校验XML
*/
public static void validateXMLByDTD() {
//todo:暂时不用,以后再说吧
}
}
运行结果
Good! XML文件通过XSD文件校验成功!
本文转自 leizhimin 51CTO博客,原文链接:http://blog.51cto.com/lavasoft/97597,如需转载请自行联系原作者