在SQLServer 2005中处理XML格式文档

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 今天看到一则处理xml的问题,以前也有写过xml的查询,下面是问题   declare @x xml,@y xml  02set @x='   031    04姓名    05    06   07   082    09年龄    10    ...

今天看到一则处理xml的问题,以前也有写过xml的查询,下面是问题

 


declare @x xml,@y xml 

02set @x='<item>  

03<id>1 </id>  

04<title>姓名 </title>  

05<value> </value>  

06</item>  

07<item>  

08<id>2 </id>  

09<title>年龄 </title>  

10<value> </value>  

11</item>  

12'

13set @y='<item>  

14<id>1 </id>  

15<value>张三 </value>  

16</item>  

17<item>  

18<id>2 </id>  

19<value>20 </value>  

20</item>  

21'有连个变量如上所示: 

22现在要求得到下面的格式: 

23/* 

24<item> 

25    <id>1</id> 

26    <title>姓名 </title> 

27    <value>张三 </value> 

28</item> 

29<item> 

30    <id>2</id> 

31    <title>年龄 </title> 

32    <value>20 </value> 

33</item> 

34*/

  随着标准化的执行,我相信以后sql里会有更多对xml的操作。

    下面是xml操作的答案:

 

 


01        select  

02        D.x.value('./id[1]','int') AS id, 

03        D.x.value('./title[1]','nvarchar(100)') AS title, 

04        D.x.value('./value[1]','nvarchar(100)') AS [value] 

05    from @x.nodes('/*') as D(x) 

06      

07;with t1 

08as( 

09    select  

10        D.x.value('./id[1]','int') AS id, 

11        D.x.value('./title[1]','nvarchar(100)') AS title, 

12        D.x.value('./value[1]','nvarchar(100)') AS [value] 

13    from @x.nodes('/*') as D(x)), 

14t2 

15as( 

16    select  

17        D.x.value('./id[1]','int') AS id, 

18        D.x.value('./value[1]','nvarchar(100)') AS [value] 

19    from @y.nodes('/*') as D(x)) 

20select a.id,title,b.[value] 

21from t1 as a 

22left join t2 as b on a.id = b.id 

23for xml path('item')

  下面解读一下上面的sql:

  WITH AS短语,也叫做子查询部分(subquery factoring),可以让你做很多事情,定义一个SQL片断,该SQL片断会被整个SQL语句所用到。有的时候,是为了让SQL语句的可读性更高些,也有可能是在UNION ALL的不同部分,作为提供数据的部分。

  特别对于UNION ALL比较有用。因为UNION ALL的每个部分可能相同,但是如果每个部分都去执行一遍的话,则成本太高,所以可以使用WITH AS短语,则只要执行一遍即可。如果WITH AS短语所定义的表名被调用两次以上,则优化器会自动将WITH AS短语所获取的数据放入一个TEMP表里,如果只是被调用一次,则不会。而提示materialize则是强制将WITH AS短语里的数据放入一个全局临时表里。很多查询通过这种方法都可以提高速度。

  然后就是两个对xml操作的函数:

  如果希望将 XML 数据类型实例拆分为关系数据,nodes() 方法十分有用。它允许您标识将映射到新行的节点。

  每一个 xml 数据类型实例都具有隐式提供的上下文节点。对于在列或变量中存储的 XML 实例来说,它是文档节点。文档节点是位于每个 xml 数据类型实例顶部的隐式节点。 nodes() 方法的结果是一个包含原始 XML 实例的逻辑副本的行集。在这些逻辑副本中,每个行示例的上下文节点都被设置成由查询表达式标识的节点之一。这样,后续的查询可以浏览与这些上下文节点相关的节点。 您可以从行集中检索多个值。例如,可以将 value() 方法应用于 nodes() 所返回的行集,从原始 XML 实例中检索多个值。请注意,当 value() 方法应用于 XML 实例时,它仅返回一个值。

  以上是一点小小的分享,希望对大家的sql进步有帮助。

  示例

  A. 对 xml 类型的变量使用 nodes() 方法

  在此示例中,现有一个包含 顶级元素和三个 子元素的 XML 文档。此查询使用 nodes() 方法为每个 元素设置单独的上下文节点。nodes() 方法返回包含三行的行集。每行都有一个原始 XML 的逻辑副本,其中每个上下文节点都标识原始文档中的一个不同的 元素。

  然后,查询会从每行返回上下文节点:

 


DECLARE @x xml 
SET @x='<Root>
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>
    <row id="2"><name>moe</name></row>
    <row id="3" />
</Root>'
SELECT T.c.query('.') AS result
FROM   @x.nodes('/Root/row') T(c)
go
 

 

    结果如下。在此示例中,查询方法返回上下文项及其内容:

 

 


 <row id="1"><name>Larry</name><oflw>some text</oflw></row>
 <row id="2"><name>moe</name></row>
 <row id="3"/>


 

    对上下文节点应用父级取值函数将返回所有三行的 <Root> 元素。

 

 


SELECT T.c.query('..') AS result
FROM   @x.nodes('/Root/row') T(c)
go


     结果如下:

 


<Root>
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>
    <row id="2"><name>moe</name></row>
    <row id="3" />
</Root>
<Root>
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>
    <row id="2"><name>moe</name></row>
    <row id="3" />
</Root>
<Root>
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>
    <row id="2"><name>moe</name></row>
    <row id="3" />
</Root>


 

    下面的查询指定了绝对路径。对使用绝对路径表达式的上下文节点的查询,将从上下文节点的根节点开始进行。因此,您将收到由 nodes() 返回的每个上下文节点的全部三行。

 

 

 

SELECT T.c.query('/Root/row') AS result
FROM   @x.nodes('/Root/row') T(c)
go
<row id="1"><name>Larry</name><oflw>some text</oflw></row>
<row id="2"><name>moe</name></row>
<row id="3" />
<row id="1"><name>Larry</name><oflw>some text</oflw></row>
<row id="2"><name>moe</name></row>
<row id="3" />
<row id="1"><name>Larry</name><oflw>some text</oflw></row>
<row id="2"><name>moe</name></row>
<row id="3" />

 


     请注意,由 xml 数据类型的 nodes() 方法返回的列无法直接使用。例如,下面的查询将返回错误:

 


...
SELECT T.c
FROM   @x.nodes('/Root/row') T(c)

 


     在以下查询中,xml 数据类型的 value() 和 query() 方法应用到由 nodes() 方法返回的行集中。value() 方法返回上下文项 (<row>) 的 id 属性;query() 方法返回上下文项的 <name> 元素子树。

 

 


DECLARE @x xml 
SET @x='
<Root>
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>
    <row id="2"><name>Joe</name></row>
    <row id="3" />
</Root>
'
SELECT T.c.value('@id','int') as id,
       T.c.query('name') as NAME
FROM   @x.nodes('/Root/row') T(c)
go


 

    结果如下:

 

 


 id  NAME
-----------------------
 1   <name>Larry</name>
 2   <name>Joe</name>
 3   
 

 

    请注意,结果包括行 ID 3 并且 <row> 元素不包含子 <name>。如果您希望对结果进行筛选,以便返回(或不返回)不带子 <name> 的行,就可以使用下列方法之一对其进行筛选:

    使用 nodes() 路径表达式(例如 /Root/row[name])中的谓词。


    对行集使用 exist() 方法。


    使用 CROSS APPLY。


    使用 OUTER APPLY。


    以下查询对 nodes() 返回的行集指定 exist() 方法。如果上下文节点 (<row>) 包含子 <name>,则 exist() 方法返回 True。

 

 


DECLARE @x xml        
SET @x='<Root>       
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>       
    <row id="2"><name>Joe</name></row>       
    <row id="3" />       
</Root>'       
SELECT T1.rows.value('@id','int') as id       
FROM @x.nodes('/Root/row') T1(rows)       
WHERE T1.rows.exist('name') = 1;       
GO


   此查询将返回两行:行 ID 分别为 1 和 2。

  以下查询使用 OUTER APPLY。OUTER APPLY 将 nodes() 应用于 T1(行)中的每个行,并返回构成结果集的行,也会返回 NULL。因此,WHERE 子句用于筛选行并只检索 T2.names 列不为 NULL 的行。

 

 


DECLARE @x xml        
SET @x='       
<Root>       
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>       
    <row id="2"><name>Joe</name></row>       
    <row id="3" />       
</Root>'       
SELECT T1.rows.value('@id','int') as id       
FROM @x.nodes('/Root/row') T1(rows)       
OUTER APPLY T1.rows.nodes('./name') as T2(names)       
WHERE T2.names is not null       
GO      


 

    以下查询使用 CROSS APPLY。CROSS APPLY 将 nodes() 应用于外部表 [T1(行)] 中的每一行,并且只返回当 nodes() 应用于 T1.rows 时构成结果集的行。在这种情况下,您不需要 WHERE 子句来测试 IS NOT NULL。

 


DECLARE @x xml        
SET @x='<Root>       
    <row id="1"><name>Larry</name><oflw>some text</oflw></row>       
    <row id="2"><name>Joe</name></row>       
    <row id="3" />       
</Root>'       
SELECT T1.rows.value('@id','int') as id       
FROM @x.nodes('/Root/row') T1(rows)       
CROSS APPLY T1.rows.nodes('./name') as T2(names)       
GO      


   有关 CROSS APPLY 和 OUTER APPLY 的信息,请参阅使用 APPLY。

  B. 针对 xml 类型的列指定 nodes() 方法

  在此示例中使用自行车生产说明,并将其存储在 ProductModel 表的 Instructions xml 类型列中。有关详细信息,请参阅 AdventureWorks 数据库中的 xml 数据类型表示形式。

  在以下示例中,nodes() 方法是针对 ProductModel 表中 xml 类型的 Instructions 列指定的。

  nodes() 方法通过指定 /MI:root/MI:Location 路径将 元素设置为上下文节点。结果行集包括原始文档的逻辑副本,每个副本对应文档中的一个 节点,上下文节点设置为 元素。因此,nodes() 函数给出一组 上下文节点。

  query() 方法针对此行集请求 self::node,因此将返回每行中的 元素。

  在此示例中,查询在特定产品样式的生产说明文档中将每一个 元素都设置为上下文节点。您可以使用这些上下文节点来按照以下方式来检索值:

  在每个 中查找 LocationID

  在每个 中检索生产步骤( 子元素)

  此查询使用 query() 方法返回上下文项,其中指定了 self::node() 的缩写语法 "."。

  请注意以下方面:

  nodes() 方法应用于 Instructions 列并返回一个行集 T (C)。此行集包含将 /root/Location 作为上下文项的原始生产说明文档的逻辑副本。

  CROSS APPLY 将 nodes() 应用于 Instructions 表中的每一行,并只返回构成结果集的行。

 


SELECT C.query('.') as result
FROM Production.ProductModel
CROSS APPLY Instructions.nodes('
declare namespace MI="http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions";
/MI:root/MI:Location') as T(C)
WHERE ProductModelID=7
 

 


    下面是部分结果:

 

 

<MI:Location LocationID="10"  ...>
   <MI:step ... />
      ...
</MI:Location>
<MI:Location LocationID="20"  ... >
    <MI:step ... />
      ...
</MI:Location>
...

 


     以下查询与先前的查询相似,但是它通过使用行集中的上下文节点,利用 value() 和 query() 检索一组值。对于每个位置,SELECT 子句都检索在该位置使用的位置 ID 和工具。

 

 


SELECT C.value('@LocationID','int') as LId,
       C.query('declare namespace MI="http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions";
                 MI:step/MI:tool') as result
FROM    Production.ProductModel
CROSS APPLY Instructions.nodes('
declare namespace MI="http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions";
/MI:root/MI:Location') as T(C)
WHERE ProductModelID=7
 

 

    结果如下。为提高可读性,未显示命名空间。

 


 LId  result
 10  <MI:tool xmlns:MI="...">T-85A framing tool</MI:tool>
     <MI:tool xmlns:MI="...">Trim Jig TJ-26</MI:tool>
     <MI:tool xmlns:MI="...">router with a carbide tip 15</MI:tool>
      <MI:tool xmlns:MI="...">Forming Tool FT-15</MI:tool>
 20
 30  <MI:tool xmlns:MI="...">standard debur tool</MI:tool>
 45  <MI:tool xmlns:MI="...">paint harness</MI:tool>
 50
 60


   C. 将 nodes() 应用于由其他 nodes() 方法返回的行集

  以下代码查询 ProductModel 表的 Instructions 列中生产说明的 XML 文档。此查询返回包含产品样式 ID、生产位置和生产步骤的行集。

  请注意以下方面:

  首先,nodes() 方法应用于 Instructions 列并返回 T1(位置)行集。此行集包含将 /root/Location 作为上下文项的原始生产说明文档的逻辑副本。

  其次,nodes() 应用于 T1(位置)行集并返回 T2(步骤)行集。此行集包含将 /root/Location 作为上下文项的原始生产说明文档的逻辑副本。

 


SELECT ProductModelID, Locations.value('./@LocationID','int') as LocID,
steps.query('.') as Step       
FROM Production.ProductModel       
CROSS APPLY Instructions.nodes('       
declare namespace MI="http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions";       
/MI:root/MI:Location') as T1(Locations)       
CROSS APPLY T1.Locations.nodes('       
declare namespace MI="http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions";       
./MI:step ') as T2(steps)       
WHERE ProductModelID=7       
go       
-- result       
ProductModelID LocID Step       
----------------------------       
7      10   <step ... />       
7      10   <step ... />       
...       
7      20   <step ... />       
7      20   <step ... />       
7      20   <step ... />       
...      

 


     此查询两次声明 MI 前缀。此外,您可以使用 WITH XMLNAMESPACES 来声明一次前缀并在查询中使用它:

 


WITH XMLNAMESPACES (
   'http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions'  AS MI)
SELECT ProductModelID, Locations.value('./@LocationID','int') as LocID,
steps.query('.') as Step       
FROM Production.ProductModel       
CROSS APPLY Instructions.nodes('       
/MI:root/MI:Location') as T1(Locations)       
CROSS APPLY T1.Locations.nodes('       
./MI:step ') as T2(steps)       
WHERE ProductModelID=7       
go 

 


     以下查询与先前的查询相似,但是它将 exist() 方法应用于 T2(步骤)行集中的 XML,以便只检索至少使用一个生产工具的生产步骤。即:<step> 元素至少包含一个 <tool> 子元素。

 

 


WITH XMLNAMESPACES (
   'http://schemas.microsoft.com/sqlserver/2004/07/adventure-works/ProductModelManuInstructions' AS MI)
SELECT ProductModelID, 
       Locations.value('./@LocationID','int') as LocID,
       steps.query('.') as Steps
FROM   Production.ProductModel
CROSS APPLY Instructions.nodes('/MI:root/MI:Location') as T1(Locations)
CROSS APPLY T1.Locations.nodes('./MI:step') as T2(steps)
WHERE  ProductModelID=7
AND    steps.exist('./MI:tool') = 1
Go

 

 

原文出处:http://www.cnblogs.com/MR_ke/archive/2010/08/23/1806460.html
TechTarget中国原创内容,原文链接:http://www.searchdatabase.com.cn/showcontent_39469.htm

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
5月前
|
XML 存储 JavaScript
DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧
**XML DOM 遍历、操作和导航概述** - 遍历XML节点树用于提取信息,例如,通过JavaScript的DOM API循环`&lt;book&gt;`子节点显示名称和值。 - DOM解析器处理XML文本数据,包括解析字符数据(PCDATA)和识别CDATA段。 - 节点导航涉及`parentNode`、`childNodes`等属性,`get_nextSibling`等辅助函数避免空文本节点。 - `getElementsByTagName`、`getAttribute`和`nodeValue`用于检索元素、属性值和文本。
79 6
DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧
|
2月前
|
XML 数据采集 存储
使用Java和XPath在XML文档中精准定位数据
在数据驱动的时代,从复杂结构中精确提取信息至关重要。XML被广泛用于数据存储与传输,而XPath则能高效地在这些文档中导航和提取数据。本文深入探讨如何使用Java和XPath精准定位XML文档中的数据,并通过小红书的实际案例进行分析。首先介绍了XML及其挑战,接着阐述了XPath的优势。然后,提出从大型XML文档中自动提取特定产品信息的需求,并通过代理IP技术、设置Cookie和User-Agent以及多线程技术来解决实际网络环境下的数据抓取问题。最后,提供了一个Java示例代码,演示如何集成这些技术以高效地从XML源中抓取数据。
使用Java和XPath在XML文档中精准定位数据
|
5月前
|
XML JSON 前端开发
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(简单支持发起人与审批人的流程)
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(简单支持发起人与审批人的流程)
298 2
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(简单支持发起人与审批人的流程)
|
5月前
|
XML JSON 前端开发
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(支持并行网关)
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(支持并行网关)
254 3
|
5月前
|
XML JSON 前端开发
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(排它条件网关)
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(排它条件网关)
87 3
基于若依的ruoyi-nbcio流程管理系统仿钉钉流程json转bpmn的flowable的xml格式(排它条件网关)
|
4月前
|
XML JSON 开发框架
一篇文章讲明白JSON格式转换成XML格式
一篇文章讲明白JSON格式转换成XML格式
22 0
|
4月前
|
XML JSON 开发框架
一篇文章讲明白JSON格式转换成XML格式
一篇文章讲明白JSON格式转换成XML格式
30 0
|
5月前
|
XML 存储 C#
C# xml文档反序列化记事
本文介绍了使用XmlSerializer进行XML序列化和反序列化的关键点。包括:1) 以独占方式读取XML文件以避免并发问题;2) 当元素名与类型名不一致时,可通过`[XmlArrayItem]`指定元素名,或创建继承自原始类型的子类;3) 处理DateTime反序列化错误,通过中间字符串属性转换;4) 提到了常用C#特性如`[XmlRoot]`, `[XmlElement]`, `[XmlAttribute]`, `[XmlIgnore]`和`[XmlArrayItem]`的作用。
|
5月前
|
XML JavaScript 数据格式
XML Schema(XSD)详解:定义 XML 文档结构合法性的完整指南
XML Schema(XSD)是用于定义XML文档结构的规范,它描述了元素、属性及其顺序、数据类型和约束。与DTD相比,XML Schema支持更多数据类型,如字符串、日期等,并且是基于XML的,允许扩展和重用。学习XML Schema有助于确保数据通信时双方对内容的理解一致,通过验证防止错误。示例展示了如何定义一个`note`元素,包含`to`, `from`, `heading`和`body`子元素,都是字符串类型。XML文档可以通过引用XML Schema进行验证,确保内容符合预设模式。
369 0
|
5月前
|
XML JavaScript 前端开发
XML文档节点导航与选择指南
XPath是XSLT的核心部分,用于XML文档的节点定位和选择。它采用路径表达式语法,包含200多个内置函数处理各种数据类型。XPath在编程语言如JavaScript中广泛使用,与XSLT配合进行XML转换和样式处理。它涉及7种节点类型,如元素、属性和文本,以及多种节点间关系,如父、子、同级等。XPath还使用轴(如ancestor、child)来描述节点间的关联,并支持运算符进行逻辑和数学操作。
66 0
XML文档节点导航与选择指南