SQL Server中存储过程比直接运行SQL语句慢的原因

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 原文: SQL Server中存储过程比直接运行SQL语句慢的原因     在很多的资料中都描述说SQLSERVER的存储过程较普通的SQL语句有以下优点: 1.       存储过程只在创造时进行编译即可,以后每次执行存储过程都不需再重新编译,而我们通常使用的SQL语句每执行一次就编译一次,所以使用存储过程可提高数据库执行速度。


   在很多的资料中都描述说SQLSERVER的存储过程较普通的SQL语句有以下优点:

1.       存储过程只在创造时进行编译即可,以后每次执行存储过程都不需再重新编译,而我们通常使用的SQL语句每执行一次就编译一次,所以使用存储过程可提高数据库执行速度。

2.       经常会遇到复杂的业务逻辑和对数据库的操作,这个时候就会用SP来封装数据库操作。当对数据库进行复杂操作时(如对多个表进行 Update,Insert,Query,Delete时),可将此复杂操作用存储过程封装起来与数据库提供的事务处理结合一起使用。可以极大的提高数据 库的使用效率,减少程序的执行时间,这一点在较大数据量的数据库的操作中是非常重要的。在代码上看,SQL语句和程序代码语句的分离,可以提高程序代码的 可读性。

3.       存储过程可以设置参数,可以根据传入参数的不同重复使用同一个存储过程,从而高效的提高代码的优化率和可读性。

4.       安全性高,可设定只有某此用户才具有对指定存储过程的使用权存储过程的种类:

A.       系统存储过程:以sp_开头,用来进行系统的各项设定.取得信息.相关管理工作, sp_help就是取得指定对象的相关信息。

B.       扩展存储过程 以XP_开头,用来调用操作系统提供的功能
exec master..xp_cmdshell 'ping 10.8.16.1'

C.       用户自定义的存储过程,这是我们所指的存储过程常用格式

   模版:Create procedure procedue_name [@parameter data_type][output]
   [with]{recompile|encryption} as sql_statement

   解释:output:表示此参数是可传回的

with {recompile|encryption} recompile:表示每次执行此存储过程时都重新编译一次;encryption:所创建的存储过程的内容会被加密。

 

  但是最近我们项目组中有人写了一个存储过程,其计算时间为1个小时47分钟,而有的时候运行时间都超过了两个小时,同事描述说如果将存储过程中的语句拿出来直接运行也就10分钟左右就运行完毕,我没当回事,但是今天我自己写的存储过程也遇到了这个问题,在查找资料后原因终于找到了原因,原来是Parameter sniffing问题。

   下面看我是如何将运行一个小时以上的存储过程优化成在一分钟之内完成的:

原存储过程

CREATE PROCEDURE [dbo].[pro_ImAnalysis_daily]

@THEDATE VARCHAR(30)

AS

BEGIN

   IF @THEDATE IS NULL

   BEGIN

      SET @THEDATE=CONVERT(VARCHAR(30),GETDATE()-1,112);

   END

 

 

   DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;

 

   INSERT RPT_IM_USERINFO_DAILY (THEDATE,ALLUSER,NEWUSER)

   SELECT AA.THEDATE,ALLUSER,NEWUSER

   FROM

   ( ( SELECT THEDATE,COUNT(DISTINCT USERID) ALLUSER

      FROM FACT

      WHERE THEDATE=@THEDATE

       GROUP BY THEDATE

      ) AA

      LEFT JOIN

      (SELECT THEDATE,COUNT(DISTINCT USERID) NEWUSER

       FROM FACT T1

       WHERE NOT EXISTS(

                        SELECT 1

                        FROM FACT T2

                        WHERE T2.THEDATE<@THEDATE

                             AND T1.USERID=T2.USERID)

             AND T1.THEDATE=@THEDATE

       GROUP BY THEDATE

       ) BB

      ON AA.THEDATE=BB.THEDATE);

GO

每日执行:exec pro_ImAnalysis_daily @thedate=null
耗时:1小时47~2小时13

经过查找资料,原因如下(由于源文是一篇英文,有些地方写的我不是特别清楚,原文见http://groups.google.com/group/microsoft.public.sqlserver.server/msg/ad37d8aec76e2b8f?hl=en&lr=&ie=UTF-8&oe=UTF-8):

   SQL Server中有一个叫做 “Parameter sniffing”的特性。SQL Server在存储过程执行之前都会制定一个执行计划。在上面的例子中,SQL在编译的时候并不知道@thedate的值是多少,所以它在执行执行计划的时候就要进行大量的猜测。假设传递给@thedate的参数大部分都是非空字符串,而FACT表中有40%thedate字段都是null,那么SQL Server就会选择全表扫描而不是索引扫描来对参数@thedate制定执行计划。全表扫描是在参数为空或为0的时候最好的执行计划。但是全表扫描严重影响了性能。

   假设你第一次使用了Exec pro_ImAnalysis_daily @thedate=’20080312’那么SQL Server就会使用20080312这个值作为下次参数@thedate的执行计划的参考值,而不会进行全表扫描了,但是如果使用@thedate=null,则下次执行计划就要根据全表扫描进行了。

   有两种方式能够避免出现“Parameter sniffing”问题:

(1)通过使用declare声明的变量来代替参数:使用set @variable=@thedate的方式,将出现@thedatesql语句全部用@variable来代替。

(2)  将受影响的sql语句隐藏起来,比如:

a)      将受影响的sql语句放到某个子存储过程中,比如我们在@thedate设置成为今天后再调用一个字存储过程将@thedate作为参数传入就可以了。

b)      使用sp_executesql来执行受影响的sql。执行计划不会被执行,除非sp_executesql语句执行完。

c)      使用动态sql”EXEC(@sql)”来执行受影响的sql

采用(1)的方法改造例子中的存储过程,如下:

   ALTER PROCEDURE [dbo].[pro_ImAnalysis_daily]

@var_thedate VARCHAR(30)

 

AS

BEGIN

   declare @THEDATE VARCHAR(30)

   IF @var_thedate IS NULL

   BEGIN

      SET @var_thedate=CONVERT(VARCHAR(30),GETDATE()-1,112);

   END

 

 

    SET @THEDATE=@var_thedate;

   DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;

 

  INSERT RPT_IM_USERINFO_DAILY (THEDATE,ALLUSER,NEWUSER)

   SELECT AA.THEDATE,ALLUSER,NEWUSER

   FROM

   ( ( SELECT THEDATE,COUNT(DISTINCT USERID) ALLUSER

      FROM FACT

      WHERE THEDATE=@THEDATE

       GROUP BY THEDATE

      ) AA

      LEFT JOIN

      (SELECT THEDATE,COUNT(DISTINCT USERID) NEWUSER

       FROM FACT T1

       WHERE NOT EXISTS(

                        SELECT 1

                        FROM FACT T2

                        WHERE T2.THEDATE<@THEDATE

                             AND T1.USERID=T2.USERID)

             AND T1.THEDATE=@THEDATE

       GROUP BY THEDATE

       ) BB

      ON AA.THEDATE=BB.THEDATE);

GO

 

测试执行速度为10分钟,我又检查了一下这个SQL,发现这个SQL有问题,这个SQL使用了not exists,在一个大表里面使用not exists是不太明智的,所以,我又对这个sql进行了改进,改成如下:

   ALTER PROCEDURE [dbo].[pro_ImAnalysis_daily]

@var_thedate VARCHAR(30)

 

AS

BEGIN

   declare @THEDATE VARCHAR(30)

   IF @var_thedate IS NULL

   BEGIN

      SET @var_thedate=CONVERT(VARCHAR(30),GETDATE()-1,112);

   END

 

 

    SET @THEDATE=@var_thedate;

   DELETE FROM RPT_IM_USERINFO_DAILY WHERE THEDATE=@THEDATE;

 

   INSERT RPT_IM_USERINFO_DAILY(THEDATE,ALLUSER,NEWUSER)

   select @thedate as thedate,

          count(distinct case when today>0 then userid else null end) as alluser,

          count(distinct case when dates=0 then userid else null end) as newuser

   from

   (

      select userid,

             count(CASE WHEN thedate>=@thedate then null else thedate end) as dates,

             count(case when thedate=@thedate then thedate else null end) as today

      from   FACT

      group by userid

   )as fact

GO

测试结果为30ms以下。

 

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
3月前
|
存储 SQL 数据库
SQL Server存储过程的优缺点
【10月更文挑战第18天】SQL Server 存储过程具有提高性能、增强安全性、代码复用和易于维护等优点。它可以减少编译时间和网络传输开销,通过权限控制和参数验证提升安全性,支持代码共享和复用,并且便于维护和版本管理。然而,存储过程也存在可移植性差、开发和调试复杂、版本管理问题、性能调优困难和依赖数据库服务器等缺点。使用时需根据具体需求权衡利弊。
|
12天前
|
SQL Java 数据库连接
如何在 Java 代码中使用 JSqlParser 解析复杂的 SQL 语句?
大家好,我是 V 哥。JSqlParser 是一个用于解析 SQL 语句的 Java 库,可将 SQL 解析为 Java 对象树,支持多种 SQL 类型(如 `SELECT`、`INSERT` 等)。它适用于 SQL 分析、修改、生成和验证等场景。通过 Maven 或 Gradle 安装后,可以方便地在 Java 代码中使用。
131 11
|
3月前
|
SQL 关系型数据库 MySQL
拖.sql文件到cmd中运行
通过命令行工具cmd来运行SQL脚本文件,包括登录MySQL数据库、选择数据库和使用source命令执行脚本文件的步骤。
45 0
|
3月前
|
存储 SQL 缓存
SQL Server存储过程的优缺点
【10月更文挑战第22天】存储过程具有代码复用性高、性能优化、增强数据安全性、提高可维护性和减少网络流量等优点,但也存在调试困难、移植性差、增加数据库服务器负载和版本控制复杂等缺点。
190 1
|
3月前
|
存储 SQL 数据库
Sql Server 存储过程怎么找 存储过程内容
Sql Server 存储过程怎么找 存储过程内容
241 1
|
3月前
|
存储 SQL 数据库
SQL Server存储过程的优缺点
【10月更文挑战第17天】SQL Server 存储过程是预编译的 SQL 语句集,存于数据库中,可重复调用。它能提高性能、增强安全性和可维护性,但也有可移植性差、开发调试复杂及可能影响数据库性能等缺点。使用时需权衡利弊。
|
3月前
|
存储 SQL 数据库
SQL Server 临时存储过程及示例
SQL Server 临时存储过程及示例
70 3
|
3月前
|
存储 SQL 安全
|
3月前
|
存储 SQL 数据库
使用SQL创建视图和存储过程
使用SQL创建视图和存储过程
29 0
|
3月前
|
SQL 数据库
执行 Transact-SQL 语句或批处理时发生了异常。 (Microsoft.SqlServer.ConnectionInfo)之解决方案
执行 Transact-SQL 语句或批处理时发生了异常。 (Microsoft.SqlServer.ConnectionInfo)之解决方案
615 0