在SQL Server 2005中用存储过程实现搜索功能

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介:

现在很多网站都提供了站内的搜索功能,有的很简单在SQL语句里加一个条件如:where names like ‘%words%’就可以实现最基本的搜索了。

我们来看看功能强大一点,复杂一点的搜索是如何实现的(在SQL SERVER200/2005通过存储过程实现搜索算法)。

我们把用户的搜索可以分为以下两种:

1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.

2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序,称为ALL-Word Search.

3.对输入的词只要有一个出现就为匹配 称为Any-Word Search


一、对搜索结果进行排序的算法

在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的,而在SQLSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数,我们要自己写一个UDFUser-Defined Functions,UDFSQLSERVER的内部函数,可以被存储过程调用或者被其他UDF调用。函数如下:

1 CREATE FUNCTION dbo.WordCount
2
3 ( @Word VARCHAR( 15),
4
5 @Phrase VARCHAR( 1000))
6
7 RETURNS SMALLINT
8
9 AS
10
11 BEGIN
12
13 /* 如果@Word 或者@Phrase 为空返回 0 */
14
15 IF @Word IS NULL OR @Phrase IS NULL RETURN 0
16
17 /* @BiggerWord 比@Word长一个字符 */
18
19 DECLARE @BiggerWord VARCHAR( 21)
20
21 SELECT @BiggerWord = @Word + ' x '
22
23 /*在 @Phrase用@BiggerWord替换@Word */
24
25 DECLARE @BiggerPhrase VARCHAR( 2000)
26
27 SELECT @BiggerPhrase = REPLACE ( @Phrase, @Word, @BiggerWord)
28
29 /* 相减结果就是出现的次数了 */
30
31 RETURN LEN( @BiggerPhrase) - LEN( @Phrase)
32
33 END
34

以上就是整个UDF,它用了一个很高效的方法来计算关键词出现的次数。

二、参数传递

用户输入的关键词从一个到多个不等,我们可以把参数固定为@word1~@word5,这样比较方面实现。当用户输入超过5个时,忽略不计,少于5个的地方视为空。其实GOOGLE也是这样做的,只是GOOGLE的最大词语限制是10个。

三、搜索的实现过程

假定我们对Product表进行搜索,Product字段有:Id,Name ,Descripton(产品描述),搜索要同时对Name Description进行。

Any-World Search实现如下:

1 SELECT Product.Name,
2 3 * WordCount( @Word1, Name) + WordCount( @Word1, Description) +
3
4 3 * WordCount( @Word2, Name) + WordCount( @Word2, Description) +
5
6
7
8 AS Rank
9 FROM Product
10
11

这里对Name赋予权重为3Description1(大家根据实际情况赋予不同的权重),Rank是计算列,通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。


同样的
All-Word Search实现如下:

1 SELECT Product.Name,
2
3 ( 3 * WordCount( @Word1, Name) + WordCount( @Word1, Description)) *
4
5 CASE
6
7 WHEN @Word2 IS NULL THEN 1
8
9 ELSE 3 * WordCount( @Word2, Name) + WordCount( @Word2, Description)
10
11 END *
12
13
14
15 AS Rank
16
17 FROM Product
18


这时把每个关键词出现的次数相乘只要一个没出现

RANK 就为 0 ,为 0 就是搜索结果为空。

还可以这样实现:


1 SELECT Product.Name,
2 CASE
3 WHEN @Word1 IS NULL THEN 0
4 ELSE ISNULL( NULLIF(dbo.WordCount( @Word1, Name + ' ' + Description), 0), - 1000)
5 END +
6 CASE
7 WHEN @Word2 IS NULL THEN 0
8 ELSE ISNULL( NULLIF(dbo.WordCount( @Word2, Name + ' ' + Description), 0), - 1000)
9 END +
10
11 AS Rank
12 FROM Product

对没出现的关键词赋值-1000,这样Rank就肯定为负数,负数表示搜索结果为空。

四、对结果进行分页

搜索的结果可能很多,对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了,这里就不在详细复述了。

过程简单来说就是创建一个临时表,表中包含行号,读取时按行号来读取数据


五、完整代码

经过前面的分析,完整代码如下:

1 CREATE PROCEDURE SearchCatalog
2 (
3 @PageNumber TINYINT,
4 @ProductsPerPage TINYINT,
5 @HowManyResults SMALLINT OUTPUT,
6 @AllWords BIT,
7 @Word1 VARCHAR( 15) = NULL,
8 @Word2 VARCHAR( 15) = NULL,
9 @Word3 VARCHAR( 15) = NULL,
10 @Word4 VARCHAR( 15) = NULL,
11 @Word5 VARCHAR( 15) = NULL)
12 AS
13 /* 创建临时表,保存搜索的结果(Sql Server2005适用,Sql Server2000见如何在数据层分页以提高性能) */
14 DECLARE @Products TABLE
15 (RowNumber SMALLINT IDENTITY ( 1, 1) NOT NULL,
16 ID INT,
17 Name VARCHAR( 50),
18 Description VARCHAR( 1000),
19 Rank INT)
20
21 /* Any-words search */
22 IF @AllWords = 0
23 INSERT INTO @Products
24 SELECT ID, Name, Description,
25 3 * dbo.WordCount( @Word1, Name) + dbo.WordCount( @Word1, Description) +
26
27 3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2, Description) +
28
29 3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3, Description) +
30
31 3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4, Description) +
32
33 3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5, Description)
34
35 AS Rank
36
37 FROM Product
38 ORDER BY Rank DESC
39
40 /* all-words search */
41
42 IF @AllWords = 1
43
44 INSERT INTO @Products
45
46 SELECT ID, Name, Description,
47
48 ( 3 * dbo.WordCount( @Word1, Name) + dbo.WordCount
49
50 ( @Word1, Description)) *
51
52 CASE
53
54 WHEN @Word2 IS NULL THEN 1
55
56 ELSE 3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2,
57
58 Description)
59
60 END *
61
62 CASE
63
64 WHEN @Word3 IS NULL THEN 1
65
66 ELSE 3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3,
67
68 Description)
69
70 END *
71
72 CASE
73
74 WHEN @Word4 IS NULL THEN 1
75
76 ELSE 3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4,
77
78 Description)
79
80 END *
81
82 CASE
83
84 WHEN @Word5 IS NULL THEN 1
85
86 ELSE 3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5,
87
88 Description)
89
90 END
91
92 AS Rank
93
94 FROM Product
95
96 ORDER BY Rank DESC
97
98 /* 在外部变量保存搜索结果数 */
99
100 SELECT @HowManyResults = COUNT( *)
101
102 FROM @Products
103
104 WHERE Rank > 0
105
106 /* 按页返回结果*/
107
108 SELECT ProductID, Name, Description, Price, Image1FileName,
109
110 Image2FileName, Rank
111
112 FROM @Products
113
114 WHERE Rank > 0
115
116 AND RowNumber BETWEEN ( @PageNumber - 1) * @ProductsPerPage + 1
117
118 AND @PageNumber * @ProductsPerPage
119 ORDER BY Rank DESC



本文转自高海东博客园博客,原文链接:http://www.cnblogs.com/ghd258/archive/2006/11/17/563218.html,如需转载请自行联系原作者
相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
相关文章
|
3月前
|
存储 SQL 数据库
SQL Server存储过程的优缺点
【10月更文挑战第18天】SQL Server 存储过程具有提高性能、增强安全性、代码复用和易于维护等优点。它可以减少编译时间和网络传输开销,通过权限控制和参数验证提升安全性,支持代码共享和复用,并且便于维护和版本管理。然而,存储过程也存在可移植性差、开发和调试复杂、版本管理问题、性能调优困难和依赖数据库服务器等缺点。使用时需根据具体需求权衡利弊。
|
2月前
|
SQL 关系型数据库 MySQL
SQL中,可以使用 `ORDER BY` 子句来实现排序功能
【10月更文挑战第26天】SQL中,可以使用 `ORDER BY` 子句来实现排序功能
198 6
|
3月前
|
存储 SQL 缓存
SQL Server存储过程的优缺点
【10月更文挑战第22天】存储过程具有代码复用性高、性能优化、增强数据安全性、提高可维护性和减少网络流量等优点,但也存在调试困难、移植性差、增加数据库服务器负载和版本控制复杂等缺点。
171 1
|
3月前
|
存储 SQL 数据库
Sql Server 存储过程怎么找 存储过程内容
Sql Server 存储过程怎么找 存储过程内容
208 1
|
3月前
|
存储 SQL 数据库
SQL Server存储过程的优缺点
【10月更文挑战第17天】SQL Server 存储过程是预编译的 SQL 语句集,存于数据库中,可重复调用。它能提高性能、增强安全性和可维护性,但也有可移植性差、开发调试复杂及可能影响数据库性能等缺点。使用时需权衡利弊。
|
3月前
|
存储 SQL 数据库
SQL Server 临时存储过程及示例
SQL Server 临时存储过程及示例
66 3
|
2月前
|
SQL 关系型数据库 MySQL
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
49 0
|
3月前
|
存储 SQL 安全
|
3月前
|
存储 SQL 数据库
使用SQL创建视图和存储过程
使用SQL创建视图和存储过程
27 0
|
4月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")