MSSQL On Linux In-Memory OLTP

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介: # 问题引出 菜鸟一口气写了好几篇关于MSSQL On Linux的文章了,老鸟看在眼里喜在心理,于是又来到菜鸟窝边:“MSSQL On Linux目前有很多炫酷的功能都不支持,比如AlwaysOn,Mirroring,SQLAgent,Replication等,但是In-Memory OLTP还是支持的,你去好好研究下,也许以后,说不定阿里云RDS SQL Server会跑在Linux平台上哟

问题引出

菜鸟一口气写了好几篇关于MSSQL On Linux的文章了,老鸟看在眼里喜在心理,于是又来到菜鸟窝边:“MSSQL On Linux目前有很多炫酷的功能都不支持,比如AlwaysOn,Mirroring,SQLAgent,Replication等,但是In-Memory OLTP还是支持的,你去好好研究下,也许以后,说不定阿里云RDS SQL Server会跑在Linux平台上哟。”。
领了命令的菜鸟开始了MSSQL On Linux In-Memory OLTP的研究之旅。

数据库配置

为了使用In-Memory OLTP,推荐将数据库兼容级别设置为130。

USE AdventureWorks2008R2
GO
IF NOT EXISTS(
    SELECT TOP 1 *
    FROM sys.databases as d
    WHERE d.name = Db_Name()
    AND d.compatibility_level >= 130
)
BEGIN
    ALTER DATABASE CURRENT
    SET COMPATIBILITY_LEVEL = 130;
END
GO

让memory-optimized table在SNAPSHOT事务隔离级工作,当用户访问memory-optimized table时使用的较低隔离级别将自动提升到 SNAPSHOT 隔离。

ALTER DATABASE CURRENT SET MEMORY_OPTIMIZED_ELEVATE_TO_SNAPSHOT=ON
GO

在创建memory-optimized table之前,增加Memory Optimized FILEGROUP。

ALTER DATABASE AdventureWorks2008R2 
    ADD FILEGROUP AdventureWorks2008R2_mod CONTAINS memory_optimized_data
GO 

EXEC sys.xp_create_subdir 'C:\var\opt\mssql\data\AdventureWorks2008R2\MOD'
GO
ALTER DATABASE AdventureWorks2008R2 
    ADD FILE (NAME='AdventureWorks2008R2_mod', FILENAME='C:\var\opt\mssql\data\AdventureWorks2008R2\MOD\AdventureWorks2008R2_mod') 
    TO FILEGROUP AdventureWorks2008R2_mod
GO

创建内存优化表

接下来,创建memory-optimized table,内存优化表数据存储在内存里面,与基于磁盘的表最大的区别在于不需要SQL Server系统将数据从磁盘读入到SQL Server缓存里面,加之in-Memory OLTP是lock and latch free的架构设计,因此效率有极大的提升。

USE AdventureWorks2008R2
go
IF OBJECT_ID('Orders','U') IS NOT NULL
BEGIN
    DELETE FROM dbo.Orders
    DROP TABLE dbo.Orders
END 
GO

CREATE TABLE dbo.Orders (
OrderID INT NOT NULL IDENTITY(1,1) PRIMARY KEY NONCLUSTERED
, OrderDate datetime2 NOT NULL INDEX ix_OrderDate NONCLUSTERED HASH WITH (BUCKET_COUNT=1000000)
, CustomerID int
, SourceID int
, StatusID int
, Amount decimal (18, 2)
)
--WITH (MEMORY_OPTIMIZED = ON, DURABILITY = SCHEMA_AND_DATA)
WITH (MEMORY_OPTIMIZED = ON, DURABILITY = SCHEMA_ONLY)
GO

创建本地编译存储过程

最后,创建本地编译存储过程,SQL Server允许此类型的存储过程来访问内存优化表。本地编译存储过程的T-SQL语句会被直接编译为机器码,以本地DLL的方式进行快速的数据访问和查询,相对于传统的T-SQL语句拥有更高的性能。

USE AdventureWorks2008R2
Go
CREATE PROCEDURE dbo.usp_InsertSampleOrders (
    @InsertTotalCount int 
)
WITH NATIVE_COMPILATION, SCHEMABINDING AS 
BEGIN ATOMIC 
    WITH (TRANSACTION ISOLATION LEVEL = SNAPSHOT, LANGUAGE = N'us_english')
    DECLARE 
        @i INT = 0
    ;

    WHILE @i < @InsertTotalCount 
    BEGIN 
        INSERT INTO dbo.Orders values (SYSDATETIME(), 1, 1, 1, 1);
        
        SET
            @i = @i + 1
        ;
    END
END
GO

USE AdventureWorks2008R2
GO
IF OBJECT_ID('dbo.usp_QuerySamplesOrders','p') IS NOT NULL
    DROP PROC dbo.usp_QuerySamplesOrders
GO

CREATE PROCEDURE dbo.usp_QuerySamplesOrders(
    @queryCount int
)
WITH NATIVE_COMPILATION, SCHEMABINDING
AS BEGIN ATOMIC WITH   
(  TRANSACTION ISOLATION LEVEL = SNAPSHOT,  
  LANGUAGE = 'english')  
  
  SELECT TOP(@queryCount) OrderID,OrderDate,CustomerID,SourceID,StatusID,Amount
  FROM dbo.orders

END
GO

创建基于磁盘的表

为了进行对照测试,创建常规的磁盘表对象和存储过程对象,和内存优化表是对应起来的。

USE TestDB
GO

IF OBJECT_ID('Orders','U') IS NOT NULL
BEGIN
    TRUNCATE TABLE dbo.Orders
    DROP TABLE dbo.Orders
END 
GO
CREATE TABLE Orders (
OrderID INT NOT NULL IDENTITY(1,1) PRIMARY KEY NONCLUSTERED
, OrderDate datetime2
, CustomerID int
, SourceID int
, StatusID int
, Amount decimal (18, 2)
)
GO



USE TestDB
Go
CREATE PROCEDURE dbo.usp_InsertSampleOrders (
    @InsertTotalCount int 
)
AS
BEGIN    
    SET NOCOUNT ON
    DECLARE 
        @i INT = 0
    ;

    WHILE @i < @InsertTotalCount 
    BEGIN 
        INSERT INTO dbo.Orders values (SYSDATETIME(), 1, 1, 1, 1);
        
        SET
            @i = @i + 1
        ;
    END
END
GO

USE TestDB
GO
IF OBJECT_ID('dbo.usp_QuerySamplesOrders','p') IS NOT NULL
    DROP PROC dbo.usp_QuerySamplesOrders
GO

CREATE PROCEDURE dbo.usp_QuerySamplesOrders(
    @queryCount int
)
AS 
BEGIN
    SELECT TOP(@queryCount) OrderID,OrderDate,CustomerID,SourceID,StatusID,Amount
    FROM dbo.orders

END
GO

性能测试

以下是对比内存优化表和磁盘表的性能测试对比,主要是从写和读场景来对比的。

内存优化表INSERT测试

内存优化表写入测试,利用本地编译存储过程分别写入10万,20万,40万,80万和160万笔记录,最后统计存储过程执行时间。

USE AdventureWorks2008R2
Go
SET NOCOUNT ON
SET STATISTICS TIME ON
EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 100000
SET STATISTICS TIME OFF
DELETE FROM dbo.Orders
SET STATISTICS TIME ON
EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 200000
SET STATISTICS TIME OFF
DELETE FROM dbo.Orders
SET STATISTICS TIME ON
EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 400000
SET STATISTICS TIME OFF
DELETE FROM dbo.Orders
SET STATISTICS TIME ON
EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 800000
SET STATISTICS TIME OFF
DELETE FROM dbo.Orders
SET STATISTICS TIME ON
EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 1600000
SET STATISTICS TIME OFF

执行时间如下:
01.png

从内存表最终的执行时间消耗来看,写入10万,20万,40万,80万和160万笔记录时间消耗分别为966,1874,3765,7433和15537毫秒。写入160万条记录数只花了15.5秒时间,平均每秒写入量超过10万比记录,内存优化表的写效率还是相当高的。

磁盘表执行INSERT测试

接下来是对基于磁盘的表进行写入测试,方法还是调用存储过程分别写入10万,20万,40万,80万和160万笔记录,最后来看时间消耗。

USE TestDB
Go
SET NOCOUNT ON

declare
    @ms_ticks1 bigint
    ,@ms_ticks2 bigint
    ,@ms_ticks3 bigint
    ,@ms_ticks4 bigint
    ,@ms_ticks5 bigint
    ,@ms_ticks6 bigint
    ;

SELECT TOP 1 @ms_ticks1 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)

EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 100000

SELECT TOP 1 @ms_ticks2 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)

TRUNCATE TABLE dbo.Orders

EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 200000

SELECT TOP 1 @ms_ticks3 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)

TRUNCATE TABLE dbo.Orders

EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 400000

SELECT TOP 1 @ms_ticks4 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)

TRUNCATE TABLE dbo.Orders

EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 800000

SELECT TOP 1 @ms_ticks5 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)

TRUNCATE TABLE dbo.Orders

EXEC dbo.usp_InsertSampleOrders  @InsertTotalCount = 1600000

SELECT TOP 1 @ms_ticks6 = ms_ticks
FROM sys.dm_os_sys_info WITH(NOLOCK)
TRUNCATE TABLE dbo.Orders


SELECT
    ms_ticks1 = @ms_ticks1
    ,ms_ticks2 = @ms_ticks2
    ,ms_ticks3 = @ms_ticks3
    ,ms_ticks4 = @ms_ticks4
    ,ms_ticks5 = @ms_ticks5
    ,ms_ticks6 = @ms_ticks6
    ,[2-1] = @ms_ticks2 - @ms_ticks1
    ,[3-2] = @ms_ticks3 - @ms_ticks2
    ,[4-3] = @ms_ticks4 - @ms_ticks3
    ,[5-4] = @ms_ticks5 - @ms_ticks4
    ,[6-5] = @ms_ticks6 - @ms_ticks5
;

执行结果如下图
02.png

从基于磁盘的表写入时间消耗来看,10万,20万,40万,80万和160万笔记录写入时间消耗分别为30171,58147,108002,231528和473753毫秒,160万条记录,平均秒钟不到4000条。

内存优化表QUERY测试

内存优化表读取测试,利用本地编译存储过程分别读出10万,20万,40万,80万和160万笔记录,最后统计存储过程执行时间。

-----Query Testing
USE AdventureWorks2008R2
Go
SET NOCOUNT ON
SET STATISTICS TIME OFF
SET STATISTICS TIME ON
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 100000
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 200000
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 400000
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 800000
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 1600000
SET STATISTICS TIME OFF

内存优化表执行读取测试的最终结果如下图:
03.png

在做数据读取操作的同时,菜鸟也通过Linux命令iostat查看IO统计情况。

# iostat -x 1

从监控来看,SQL Server on Linux全程没有IO读取磁盘操作
04.png

磁盘表执行QUERY测试

基于磁盘的表执行查询测试,为了防止SQL Server的数据缓存对测试结果造成影响,在每一批测试之前,手动清空SQL Server数据缓存(Buffer Pool)。

USE TestDB
Go
SET NOCOUNT ON
SET STATISTICS TIME OFF
SET STATISTICS TIME ON
DBCC DROPCLEANBUFFERS
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 100000
DBCC DROPCLEANBUFFERS
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 200000
DBCC DROPCLEANBUFFERS
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 400000
DBCC DROPCLEANBUFFERS
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 800000
DBCC DROPCLEANBUFFERS
EXEC dbo.usp_QuerySamplesOrders  @queryCount = 1600000
SET STATISTICS TIME OFF

同样在一边读取测试操作的时候,菜鸟一边使用iostat查看磁盘IO读取情况。可以明显的看到Linux系统有IO Read操作,这从侧面证明了基于磁盘的表Query是需要从物理硬盘读取数据的。
05.png

由于在每一批测试读取操作之前添加了删除缓存的动作,所以显示结果不是太好看,我手动删了无用信息。最终执行测试结果如下:
06.png

对比测试结果

这里对内存优化表和磁盘表写入和读取效率做一个细致的对比测试结果。

INSERT操作

将我们上面测试的结果做一个表格来对比,其中TimeCost(ms)指时间消耗,以毫秒为单位;IRPMS是指每毫秒写入表中的记录笔数。从表中数据我们可以发现两个规律:
不管是内存表还是磁盘表,写入数据速度都比较稳定,不会有太大的上上下下波动,内存表稳定在每毫秒103-107之间,磁盘表每毫秒稳定在3.3-3.7之间。
内存表写入效率很高,是磁盘表的近30倍。
07.png
将表格数据做一个炫酷无比,直截了当的图形出来:
08.png

SELECT操作

相通的原理,我们将内存表和磁盘表的读取操作测试统计表格如下:
09.png

将表格数据使用图形化的方式形象出来:
10.png

从读取操作来看,使用磁盘表的读取和使用内存优化表时间消耗和QRPMS(Query Records Per Milliseconds)几乎持平,差异非常小。这一点,是非常出乎菜鸟的意外,令菜鸟百思不得其解的,按照常理,从磁盘读取数据和内存读取数据效率应该会有天壤之别的,难道是菜鸟测试方法不对,又或是哪里搞错了?如果有知道的朋友,请不吝赐教,帮菜鸟批评指正。
菜鸟突然灵光一现,难道是因为高大上的Apple PCIE SSD读取效率已经达到内存效率级别了?带着这个问题,菜鸟使用Disk Speed Test工具测试了下PCIE SSD的读写效率,以下是对5GB大小临时文件的读写效率截图:
11.png
Apple PCIE SSD效率还真不是盖的,写效率可以达到625MB/S,读取效率是写的近三倍,达到了1862MB/S。但是,8GB DDR3-1600双通道内存的读取效率理论值1600642/1024/8可以达到25600MB/S,即25GB/S的速度啊。所以,就算是Apple PCIE SSD卡的读取效率也仅仅是内存效率读取效率的不到1/12啊。
12.png

写在最后

虽然菜鸟研究了MSSQL on Linux In-Memory OLTP,的确内存优化表的写效率可以达到磁盘写效率的30倍,但是读效率没有太大的提升,这点让菜鸟十分忐忑,将信将疑。

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
5月前
|
Linux 数据库 数据安全/隐私保护
|
SQL 关系型数据库 Linux
使用unidac 在linux 上无驱动直接访问MS SQL SERVER
随着delphi 10.2 开始了对Linux 的重新支持。devart 也迅速的发布了unidac 7.0, 最大的特性就是支持linux和MongoDB. 并有了其他更新: In this release we added such significant features as: T...
1867 0
|
SQL 关系型数据库 Linux
MSSQL(SQL Server) on Linux 简明部署与使用
标签 PostgreSQL , ms sql , SQL Server 背景 本文介绍MS SQL on Linux的简单部署,使用。 https://docs.microsoft.com/zh-cn/sql/linux/quickstart-install-connect-red-hat?view=sql-server-2017 后面简单介绍如何将MS SQL迁移到PostgreSQL。
3165 0
|
Linux Go 数据库
MSSQL On Linux备份与还原
# 问题引出 这天老鸟喜笑颜开的找到菜鸟:“听说微软11月16号发布了MSSQL ON Linux版本了?要不要尝尝鲜?”。 “老大,我已经尝过了,你不知道我写了一篇《Happy Birthday to MSSQL On Linux》?”,这次换菜鸟得意洋洋了。 “不错嘛,那你要不要研究看看MSSQL On Linux备份与还原,看看和Windows上有没有什么区别。”,老鸟总是能给菜鸟找到
1942 0
|
SQL Linux 数据库
Happy Birthday to MSSQL On Linux
微软于2016年11月16日发布了MSSQL On Linux,这篇文章带大家来尝尝鲜,看看Linux版的SQL Server概况是什么,如何安装,以及一个简单的创建数据,创建表,插入数据,查询数据的操作。
3295 0
|
2月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
170 8
|
2月前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
704 6