最近做一个项目,遇到一个在分组的情况下,将某一列的字段值(
varchar
类型)连接起来的问题,类似于
sum
函数对
int
型字段值求和。
如有一个表
t_table
,结构和数据如图
1
图1
其中要按着 xh 字段分组,并且将每一组 name 字段值连接起来。最终结果希望如图 2 所示
图2
让我们先看三条 SQL 语句:
这三条语句分别使用 th 字段按着所有 th 可能的值来查询 t_table ,这三条 SQL 语句所查询出来的记录如图 3 所示。
图 3
得到的结果如图 4 所示。
图4
之所以使用 left join ,是因为按着 th 查询后,有的表的某些 xh 值可以没有,如图 3 中的第三个表,就没有 0003 。如果使用内连接, 0003 就无法在记录集中体现。这面的 SQL 的查询结果如图 5 所示。
图5
然后我们就可以使用如下的语句来连接 th1 、 th2 和 th3 了。
三、使用C#实现SQL Server2005的扩展聚合函数(当然,也可以用VB.NET)
这一种方法笔者认为是最“酷”的方法。因为每一个人都只想写如下的 SQL 语句就可以达到目录。
图6
点击“确定”按钮后, SQL Server 项目会要求连接一个数据库,我们可以选择一个数据库,如图 7 所示。
图7
然后在工程中加入一个聚合类( joinstr.cs ),如图 8 所示。
图8
joinstr.cs 中的最终代码如下:
要注意的是,字符串类型需要用nvarchar,而不能用varchar。
图9
如果想删除上面建立的聚合函数,可以使用如下的 SQL 语句:
图1
其中要按着 xh 字段分组,并且将每一组 name 字段值连接起来。最终结果希望如图 2 所示
图2
表中的th
字段值对于每一个xh
值是唯一的,也是有限的,也就是说,对于一个xh
值,th
的值不会太多,如最多是10
个(从1
至10
)。
以上需求最终想了三种方法来解决这个问题。
一、修改表结构
如果是新的项目,可以考虑修改一下表的结构。如果t_table
的结构修改如下:
xh value1 value2 value3 value4 .... .... value10
0001 123456 654321 456789
0002 12abcd 4d2r343 343dfd
0003 abcde3 132323
xh value1 value2 value3 value4 .... .... value10
0001 123456 654321 456789
0002 12abcd 4d2r343 343dfd
0003 abcde3 132323
这种方法将value
的值纵向改为横向,也就是说,按每一个xh
值,将value
字段的值按逆时针旋转了90
度。
但这种方法要有一个前提,就是假设xh
的每一个值所对应的value
值不会太多,如上面不超过10
个,这样才有可能建立有限个字段。如果按着上面的字段结构,只需要将这些字段加一起就可以了,也不用分组。如下所示:
select
xh , (value1
+
value2
+
value3
+
+
value10)
as
value
from
t_table
但这种方法至少有如下三个缺陷:
1.
需要修改表结构,这对于已经进行很长时间或是已经上线的项目产不适用
2.
对每一个xh
字段的value
取值数有限制,如果太多,就得建立很多字段。这样性能会降低。
3.
这样做虽然查询容易,但如果需要对每一个xh
的不同值频繁修改或加入新的值时,如果把它们都放到一行,容易因为行锁而降低性能。
二、动态生成select语句让我们先看三条 SQL 语句:
select
xh,value
as
th1
from
t_table
where
th
=
1
select xh,value as th2 from t_table where th = 2
select xh,value as th3 from t_table where th = 3
select xh,value as th2 from t_table where th = 2
select xh,value as th3 from t_table where th = 3
这三条语句分别使用 th 字段按着所有 th 可能的值来查询 t_table ,这三条 SQL 语句所查询出来的记录如图 3 所示。
图 3
然后再使用下面的语句按着xh
分组:
select
xh
from
t_table
group
by
xh
得到的结果如图 4 所示。
图4
然后使用left join
,以图4
所示的表为最左边的表,进行连接,SQL
语句如下:
select
a.xh, b.th1, c.th2, d.th3
from
( select xh from t_table group by xh) a
left join
( select xh,value as th1 from t_table where th = 1 ) b on a.xh = b.xh
left join
( select xh,value as th2 from t_table where th = 2 ) c on a.xh = c.xh
left join
( select xh,value as th3 from t_table where th = 3 ) d on a.xh = d.xh
( select xh from t_table group by xh) a
left join
( select xh,value as th1 from t_table where th = 1 ) b on a.xh = b.xh
left join
( select xh,value as th2 from t_table where th = 2 ) c on a.xh = c.xh
left join
( select xh,value as th3 from t_table where th = 3 ) d on a.xh = d.xh
之所以使用 left join ,是因为按着 th 查询后,有的表的某些 xh 值可以没有,如图 3 中的第三个表,就没有 0003 。如果使用内连接, 0003 就无法在记录集中体现。这面的 SQL 的查询结果如图 5 所示。
图5
然后我们就可以使用如下的语句来连接 th1 、 th2 和 th3 了。
select
xh, (th1
+
th2
+
th3)
as
th
from
myview
myview
表示将上面用left join
的语句保存成的视图。
下面可以将这个过程写成一条
SQL
语句:
select
xh, (th1
+
th2
+
th3)
as
th
from
(
select a.xh, ( case when b.th1 is null then '' else b.th1 end ) as th1,
( case when c.th2 is null then '' else c.th2 end ) as th2,
( case when d.th3 is null then '' else d.th3 end ) as th3
from
( select xh from t_table group by xh) a
left join
( select xh,value as th1 from t_table where th = 1 ) b on a.xh = b.xh
left join
( select xh,value as th2 from t_table where th = 2 ) c on a.xh = c.xh
left join
( select xh,value as th3 from t_table where th = 3 ) d on a.xh = d.xh
) x
(
select a.xh, ( case when b.th1 is null then '' else b.th1 end ) as th1,
( case when c.th2 is null then '' else c.th2 end ) as th2,
( case when d.th3 is null then '' else d.th3 end ) as th3
from
( select xh from t_table group by xh) a
left join
( select xh,value as th1 from t_table where th = 1 ) b on a.xh = b.xh
left join
( select xh,value as th2 from t_table where th = 2 ) c on a.xh = c.xh
left join
( select xh,value as th3 from t_table where th = 3 ) d on a.xh = d.xh
) x
由于null
加上任何字符串都为null
,因此,使用case
语句来将null
转换为空串。上面的SQL
就会得到图2
所示的查询结果。也许有的读者会问,如果th
的可能取值可变呢!如xh
为0001
的th
值四个:1
至4
。
那上面的SQL
不是要再加一个left join
吗?这样不是很不通用。
要解决这个问题也很容易。可以使用程序(如C#
、Java
等)自动生成上述的SQL
,然后由程序提交给数据库,再执行。
当然,这需要程序事先知道th
值对于当前程序最多有几个值,然后才可以自动生成上述的SQL
语句。
这种方法几乎适合于所有的数据库,不过如果
th
的取值比较多的话,可能
SQL
语句会很长,但是如果用程序自动生成的话,就不会管这些了。
三、使用C#实现SQL Server2005的扩展聚合函数(当然,也可以用VB.NET)
这一种方法笔者认为是最“酷”的方法。因为每一个人都只想写如下的 SQL 语句就可以达到目录。
select
xh, dbo.joinstr(value)
from
t_table
group
by
xh
其中joinstr
是一个聚合函数,功能是将每一组的某个字符串列的值首尾连接。上面的SQL
也可以查询图2
所示的结果。但遗憾的是,sql server2005
并未提供可以连接字符串的聚合函数。下面我们就来使用C#
来实现一个扩展聚合函数。
首先用
VS2008/VS2005
建立一个
SQL Server
项目,如图
6
所示。
图6
点击“确定”按钮后, SQL Server 项目会要求连接一个数据库,我们可以选择一个数据库,如图 7 所示。
图7
然后在工程中加入一个聚合类( joinstr.cs ),如图 8 所示。
图8
joinstr.cs 中的最终代码如下:
using
System;
using System.Data;
using Microsoft.SqlServer.Server;
using System.Data.SqlTypes;
using System.IO;
using System.Text;
[Serializable]
[SqlUserDefinedAggregate(
Format.UserDefined, // use custom serialization to serialize the intermediate result
IsInvariantToNulls = true , // optimizer property
IsInvariantToDuplicates = false , // optimizer property
IsInvariantToOrder = false , // optimizer property
MaxByteSize = 8000 ) // maximum size in bytes of persisted value
]
public struct joinstr :IBinarySerialize
{
private System.Text.StringBuilder intermediateResult;
public void Init()
{
// 在此处放置代码
intermediateResult = new System.Text.StringBuilder();
}
public void Accumulate(SqlString Value)
{
intermediateResult.Append(Value.Value);
}
public void Merge(joinstr Group)
{
intermediateResult.Append(Group.intermediateResult);
}
public SqlString Terminate()
{
return new SqlString(intermediateResult.ToString());
}
public void Read(BinaryReader r)
{
intermediateResult = new StringBuilder(r.ReadString());
}
public void Write(BinaryWriter w)
{
w.Write( this .intermediateResult.ToString());
}
}
using System.Data;
using Microsoft.SqlServer.Server;
using System.Data.SqlTypes;
using System.IO;
using System.Text;
[Serializable]
[SqlUserDefinedAggregate(
Format.UserDefined, // use custom serialization to serialize the intermediate result
IsInvariantToNulls = true , // optimizer property
IsInvariantToDuplicates = false , // optimizer property
IsInvariantToOrder = false , // optimizer property
MaxByteSize = 8000 ) // maximum size in bytes of persisted value
]
public struct joinstr :IBinarySerialize
{
private System.Text.StringBuilder intermediateResult;
public void Init()
{
// 在此处放置代码
intermediateResult = new System.Text.StringBuilder();
}
public void Accumulate(SqlString Value)
{
intermediateResult.Append(Value.Value);
}
public void Merge(joinstr Group)
{
intermediateResult.Append(Group.intermediateResult);
}
public SqlString Terminate()
{
return new SqlString(intermediateResult.ToString());
}
public void Read(BinaryReader r)
{
intermediateResult = new StringBuilder(r.ReadString());
}
public void Write(BinaryWriter w)
{
w.Write( this .intermediateResult.ToString());
}
}
由于本例需要聚合字符串,而不是已经被序列化的类型,如int
等,因此,需要实现IBinarySerialize
接口来手动序列化。使用C#
实现SQL Server
聚合函数,也会受到字符串最大长度为8000
的限制。
在编写完上述代码后,可以使用
Visual Studio
来部署(右向工程,在弹出菜单上选“部署”即可)。也可以使用
SQL
语句来部署。
假设上面的程序生成的
dll
为
MyAggregate.dll
,可以使用下面的
SQL
语句来部署:
CREATE
ASSEMBLY MyAgg
FROM
'
D:\test\MyAggregate.dll
'
CREATE AGGREGATE joinstr ( @input nvarchar ( 200 )) RETURNS nvarchar ( max )
EXTERNAL NAME MyAgg.joinstr
CREATE AGGREGATE joinstr ( @input nvarchar ( 200 )) RETURNS nvarchar ( max )
EXTERNAL NAME MyAgg.joinstr
要注意的是,字符串类型需要用nvarchar,而不能用varchar。
第一条SQL
语句是装载dll
,第二条SQL
语句是注册joinstr
聚合函数(每一个C#
类就是一个聚合函数)
在执行上面的
SQL
语句之前,需要将
SQL Server2005
的
clr
功能打开。如图
9
所示。图9
如果想删除上面建立的聚合函数,可以使用如下的 SQL 语句:
drop
aggregate joinstr
在删除聚合函数后,可以将MyAggregate.dll
卸载。
drop
assembly MyAgg
OK
,现在可以使用joinstr
来聚合字符串了。
这种方法虽然显示很“酷”,但却要求开发人员熟悉扩展聚合函数的开发方法,如果开发人员使有的不是微软的开发工具,如使用Java ,恐怕这种方法就只能是空谈了(除非开发小组内有人会用微软的开发工具)。
这种方法虽然显示很“酷”,但却要求开发人员熟悉扩展聚合函数的开发方法,如果开发人员使有的不是微软的开发工具,如使用Java ,恐怕这种方法就只能是空谈了(除非开发小组内有人会用微软的开发工具)。
当然,如果使用其他的数据库,如oracle
、mysql
,也是可以实现类似扩展函数的功能的,如oracle
可以使用java
来进行扩展。但这要求开发人员具有更高的素质。
以上介绍的三种方法仅供参考,至于采用哪种方法,可根据实际需要和具体情况而定。如果哪位读者有更好的方法,请跟贴!
以上介绍的三种方法仅供参考,至于采用哪种方法,可根据实际需要和具体情况而定。如果哪位读者有更好的方法,请跟贴!
本文转自 androidguy 51CTO博客,原文链接:http://blog.51cto.com/androidguy/214902,如需转载请自行联系原作者