在SQL Server 2005中用存储过程实现搜索功能

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

现在很多网站都提供了站内的搜索功能,有的很简单在SQL语句里加一个条件如:where names like ‘%words%’就可以实现最基本的搜索了。

我们来看看功能强大一点,复杂一点的搜索是如何实现的(在SQL SERVER200/2005通过存储过程实现搜索算法)。

我们把用户的搜索可以分为以下两种:

1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.

2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序,称为ALL-Word Search.

3.对输入的词只要有一个出现就为匹配 称为Any-Word Search


一、对搜索结果进行排序的算法

在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的,而在SQLSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数,我们要自己写一个UDFUser-Defined Functions,UDFSQLSERVER的内部函数,可以被存储过程调用或者被其他UDF调用。函数如下:

1 CREATE FUNCTION dbo.WordCount
2
3 ( @Word VARCHAR( 15),
4
5 @Phrase VARCHAR( 1000))
6
7 RETURNS SMALLINT
8
9 AS
10
11 BEGIN
12
13 /* 如果@Word 或者@Phrase 为空返回 0 */
14
15 IF @Word IS NULL OR @Phrase IS NULL RETURN 0
16
17 /* @BiggerWord 比@Word长一个字符 */
18
19 DECLARE @BiggerWord VARCHAR( 21)
20
21 SELECT @BiggerWord = @Word + ' x '
22
23 /*在 @Phrase用@BiggerWord替换@Word */
24
25 DECLARE @BiggerPhrase VARCHAR( 2000)
26
27 SELECT @BiggerPhrase = REPLACE ( @Phrase, @Word, @BiggerWord)
28
29 /* 相减结果就是出现的次数了 */
30
31 RETURN LEN( @BiggerPhrase) - LEN( @Phrase)
32
33 END
34

以上就是整个UDF,它用了一个很高效的方法来计算关键词出现的次数。

二、参数传递

用户输入的关键词从一个到多个不等,我们可以把参数固定为@word1~@word5,这样比较方面实现。当用户输入超过5个时,忽略不计,少于5个的地方视为空。其实GOOGLE也是这样做的,只是GOOGLE的最大词语限制是10个。

三、搜索的实现过程

假定我们对Product表进行搜索,Product字段有:Id,Name ,Descripton(产品描述),搜索要同时对Name Description进行。

Any-World Search实现如下:

1 SELECT Product.Name,
2 3 * WordCount( @Word1, Name) + WordCount( @Word1, Description) +
3
4 3 * WordCount( @Word2, Name) + WordCount( @Word2, Description) +
5
6
7
8 AS Rank
9 FROM Product
10
11

这里对Name赋予权重为3Description1(大家根据实际情况赋予不同的权重),Rank是计算列,通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。


同样的
All-Word Search实现如下:

1 SELECT Product.Name,
2
3 ( 3 * WordCount( @Word1, Name) + WordCount( @Word1, Description)) *
4
5 CASE
6
7 WHEN @Word2 IS NULL THEN 1
8
9 ELSE 3 * WordCount( @Word2, Name) + WordCount( @Word2, Description)
10
11 END *
12
13
14
15 AS Rank
16
17 FROM Product
18


这时把每个关键词出现的次数相乘只要一个没出现

RANK 就为 0 ,为 0 就是搜索结果为空。

还可以这样实现:


1 SELECT Product.Name,
2 CASE
3 WHEN @Word1 IS NULL THEN 0
4 ELSE ISNULL( NULLIF(dbo.WordCount( @Word1, Name + ' ' + Description), 0), - 1000)
5 END +
6 CASE
7 WHEN @Word2 IS NULL THEN 0
8 ELSE ISNULL( NULLIF(dbo.WordCount( @Word2, Name + ' ' + Description), 0), - 1000)
9 END +
10
11 AS Rank
12 FROM Product

对没出现的关键词赋值-1000,这样Rank就肯定为负数,负数表示搜索结果为空。

四、对结果进行分页

搜索的结果可能很多,对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了,这里就不在详细复述了。

过程简单来说就是创建一个临时表,表中包含行号,读取时按行号来读取数据


五、完整代码

经过前面的分析,完整代码如下:

1 CREATE PROCEDURE SearchCatalog
2 (
3 @PageNumber TINYINT,
4 @ProductsPerPage TINYINT,
5 @HowManyResults SMALLINT OUTPUT,
6 @AllWords BIT,
7 @Word1 VARCHAR( 15) = NULL,
8 @Word2 VARCHAR( 15) = NULL,
9 @Word3 VARCHAR( 15) = NULL,
10 @Word4 VARCHAR( 15) = NULL,
11 @Word5 VARCHAR( 15) = NULL)
12 AS
13 /* 创建临时表,保存搜索的结果(Sql Server2005适用,Sql Server2000见如何在数据层分页以提高性能) */
14 DECLARE @Products TABLE
15 (RowNumber SMALLINT IDENTITY ( 1, 1) NOT NULL,
16 ID INT,
17 Name VARCHAR( 50),
18 Description VARCHAR( 1000),
19 Rank INT)
20
21 /* Any-words search */
22 IF @AllWords = 0
23 INSERT INTO @Products
24 SELECT ID, Name, Description,
25 3 * dbo.WordCount( @Word1, Name) + dbo.WordCount( @Word1, Description) +
26
27 3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2, Description) +
28
29 3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3, Description) +
30
31 3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4, Description) +
32
33 3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5, Description)
34
35 AS Rank
36
37 FROM Product
38 ORDER BY Rank DESC
39
40 /* all-words search */
41
42 IF @AllWords = 1
43
44 INSERT INTO @Products
45
46 SELECT ID, Name, Description,
47
48 ( 3 * dbo.WordCount( @Word1, Name) + dbo.WordCount
49
50 ( @Word1, Description)) *
51
52 CASE
53
54 WHEN @Word2 IS NULL THEN 1
55
56 ELSE 3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2,
57
58 Description)
59
60 END *
61
62 CASE
63
64 WHEN @Word3 IS NULL THEN 1
65
66 ELSE 3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3,
67
68 Description)
69
70 END *
71
72 CASE
73
74 WHEN @Word4 IS NULL THEN 1
75
76 ELSE 3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4,
77
78 Description)
79
80 END *
81
82 CASE
83
84 WHEN @Word5 IS NULL THEN 1
85
86 ELSE 3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5,
87
88 Description)
89
90 END
91
92 AS Rank
93
94 FROM Product
95
96 ORDER BY Rank DESC
97
98 /* 在外部变量保存搜索结果数 */
99
100 SELECT @HowManyResults = COUNT( *)
101
102 FROM @Products
103
104 WHERE Rank > 0
105
106 /* 按页返回结果*/
107
108 SELECT ProductID, Name, Description, Price, Image1FileName,
109
110 Image2FileName, Rank
111
112 FROM @Products
113
114 WHERE Rank > 0
115
116 AND RowNumber BETWEEN ( @PageNumber - 1) * @ProductsPerPage + 1
117
118 AND @PageNumber * @ProductsPerPage
119 ORDER BY Rank DESC



本文转自高海东博客园博客,原文链接:http://www.cnblogs.com/ghd258/archive/2006/11/17/563218.html,如需转载请自行联系原作者
相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
目录
打赏
0
0
0
0
46
分享
相关文章
SQL如何在CTE中使用Order By的功能
SQL Server如何在CTE中使用Order By的功能
SQL中搜索中文无效或Select中文变乱码
SQL中搜索中文无效或Select中文变乱码
SQL玩转多模态AI,轻松搞定图片+文本混合搜索
本文介绍了一种通过原生SQL实现多模态智能检索的破局思路,基于PolarDB创新融合AI智能引擎,解决传统AI检索系统数据迁移冗余和工具链割裂的问题。方案优势包括低门槛AI集成、灵活适配多场景、全链路数据安全及按需付费免运维。文章详细描述了部署资源、应用配置及方案验证步骤,并提供清理资源指南以避免额外费用。适合希望快速构建智能搜索应用的开发者参考实践。
C#程序调用Sql Server存储过程异常处理:调用存储过程后不返回、不抛异常的解决方案
本文分析了C#程序操作Sql Server数据库时偶发的不返回、不抛异常问题,并提出了解决思路。首先解析了一个执行存储过程的函数`ExecuteProcedure`,其功能是调用存储过程并返回影响行数。针对代码执行被阻塞但无异常的情况,文章总结了可能原因,如死锁、无限循环或网络问题等。随后提供了多种解决方案:1) 增加日志定位问题;2) 使用异步操作提升响应性;3) 设置超时机制避免阻塞;4) 利用线程池分离主线程;5) 通过信号量同步线程;6) 监控数据库连接状态确保可用性。这些方法可有效应对数据库操作中的潜在问题,保障程序稳定性。
187 11
SQL Server存储过程的优缺点
【10月更文挑战第18天】SQL Server 存储过程具有提高性能、增强安全性、代码复用和易于维护等优点。它可以减少编译时间和网络传输开销,通过权限控制和参数验证提升安全性,支持代码共享和复用,并且便于维护和版本管理。然而,存储过程也存在可移植性差、开发和调试复杂、版本管理问题、性能调优困难和依赖数据库服务器等缺点。使用时需根据具体需求权衡利弊。
206 1
SQL中,可以使用 `ORDER BY` 子句来实现排序功能
【10月更文挑战第26天】SQL中,可以使用 `ORDER BY` 子句来实现排序功能
618 6
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
112 0
ClkLog埋点分析系统支持自定义SQL 查询
本期主要为大家介绍ClkLog九月上线的新功能-自定义SQL查询。
ClkLog埋点分析系统支持自定义SQL 查询
SQL Server存储过程的优缺点
【10月更文挑战第22天】存储过程具有代码复用性高、性能优化、增强数据安全性、提高可维护性和减少网络流量等优点,但也存在调试困难、移植性差、增加数据库服务器负载和版本控制复杂等缺点。
390 1
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问