Sql Server之旅——第十站 看看DML操作对索引的影响 

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介:

  我们都知道建索引是需要谨慎的,当只有利大于弊的时候才适合建,我们也知道建索引是需要维护成本的,这个维护也就在于DML操作了,

下面我们具体看看到底DML对索引都有哪些内幕。。。。

一:delete操作

  现在我们已经知道,索引都是以B树的形式存在的,既然是B树,我们就要看看他们的叶子节点和分支结点,先准备点测试数据,如下图:

CREATE TABLE Person(ID INT,NAME CHAR(200))
CREATE INDEX idx_Name ON Person(NAME)

DECLARE @ch AS INT=65
WHILE @ch<=122
BEGIN
 INSERT INTO dbo.Person(ID,NAME)
 VALUES
 (
 @ch,
 REPLICATE(CHAR(@ch),200)
 )
 SET @ch=@ch+1
END

<1> 叶子结点的变化

  从上面的图中大概可以看到,当我插入完毕后,现在有4个索引数据页,其中PID=200的为分支数据页,其他三个为叶子节点数据页,分别

为175,201,202号数据页,然后我就挑选第二个叶子节点数据页201号,看看里面的数据是啥样的。

从数据页中可以看到在201号数据页中有18个槽位,当然除了通过槽位看记录条数之外,你还可以通过Pageheader中的m_slotCnt来观察记

录个数,如下图:

接下来,我们看看slot0槽位的内容是啥样,如下图:

0000000000000000: 16484848 48484848 48484848 48484848 †.HHHHHHHHHHHHHHH 
0000000000000010: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000020: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000030: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000040: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000050: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000060: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000070: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000080: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000090: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000A0: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000B0: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000C0: 48484848 48484848 48970000 00010007 †HHHHHHHHH....... 
00000000000000D0: 00020000 ††††††††††††††††††††††††††††....

看到内容之后,我们把这条记录删掉,然后快速的观察数据页的变化,很有意思的。。。。如下图:

仔细观察上面的图,你会看到m_slotCnt=18。。。。你也看到m_ghostRecCnt=1,看这个名字你就知道是“幻象”的意思。。。正因为被

标记为幻象,所以sqlserver的后台进程会在某个时候把数据正真的删除掉,比如你过个几秒之后再查看就能看到真的被清除了。

<2> 分支节点的变化

  说完叶子节点,然后我们继续看看分支节点,通过前面的博文,你应该知道在分支节点中是依次保存着排序后的每个叶子节点中的最小值,刚好

我删除了第二个叶子节点的第一个值,那这个值也正好保存在分支节点中,那下面一个问题来了,我刚才删除了ID=72的记录,那这个ID=72的还会

在分支节点中保存吗???不用太兴奋,我们用数据来说说看,继续查看200号数据页。

二:insert操作

  我们知道索引都是按照索引列升序的,那当我insert的时候,是不是需要给我插入到排序的指定位置呢???比如说我刚才删除的HHH。。。

数据,这次我再insert的时候,是不是需要给我插入到第二个数据页的slot0位置呢???下面继续用数据说话。

1 INSERT INTO dbo.Person VALUES(72,REPLICATE(CHAR(72),200))
2 DBCC PAGE(Ctrip,1,201,1)


Slot 0, Offset 0x101c, Length 212, DumpStyle BYTE

Record Type = INDEX_RECORD Record Attributes = NULL_BITMAP Record Size = 212

Memory Dump @0x000000000FE5B01C

0000000000000000: 16686868 68686868 68686868 68686868 †.hhhhhhhhhhhhhhh 
0000000000000010: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000020: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000030: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000040: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000050: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000060: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000070: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000080: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
0000000000000090: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
00000000000000A0: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
00000000000000B0: 68686868 68686868 68686868 68686868 †hhhhhhhhhhhhhhhh 
00000000000000C0: 68686868 68686868 68c10000 00010002 †hhhhhhhhh....... 
00000000000000D0: 00020000 ††††††††††††††††††††††††††††.... 

Slot 1, Offset 0x1f04, Length 212, DumpStyle BYTE

Record Type = INDEX_RECORD Record Attributes = NULL_BITMAP Record Size = 212

Memory Dump @0x000000000FE5BF04

0000000000000000: 16484848 48484848 48484848 48484848 †.HHHHHHHHHHHHHHH 
0000000000000010: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000020: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000030: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000040: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000050: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000060: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000070: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000080: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
0000000000000090: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000A0: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000B0: 48484848 48484848 48484848 48484848 †HHHHHHHHHHHHHHHH 
00000000000000C0: 48484848 48484848 48c10000 00010015 †HHHHHHHHH....... 
00000000000000D0: 00020000 ††††††††††††††††††††††††††††....

从上面可以看到,当我再次把删除的”H"插入到数据页的时候,发现“H”在201号数据页的slot1位置了,有人就奇怪了,,,为什么不在slot0

的???仔细想想确实可以告诉我们一个道理,那就是sql是不区别大小写的,所以“H”和“h”对sqlserver来说都是一样的,仔细想想其实还有

一个问题,那就是数据页分裂,比如说当你insert的数据页已满,那这时候该怎么办呢?sqlserver的手段就是数据页分裂,将满页的一半数据

导出到新分配的数据页,同样我也可以做个例子。

CREATE TABLE Person(ID INT,NAME CHAR(5) DEFAULT 'xxxxx')
CREATE INDEX idx_Name ON Person(NAME)

DECLARE @i as int=1
WHILE @i<801
BEGIN
 INSERT INTO dbo.Person(ID) VALUES(@i)
 SET @i=@i+1
END

接下来,我导出126号数据页的记录,可以看到它的范围是1-449,如下图:

下面我要做的事情就是插入一个ID在1-449范围的一条记录,这样的话就会造成数据页分裂了,对不对。

可以看到,现在多了一个192号数据页,是不是很有意思,哈哈~~~然后我就非常好奇的再次导出126,192号数据页,看看数据是不是只剩

一半啦~~~

三:update操作

  如果你看懂了上面的insert和delete,那么update就是这两个操作的组合,对不对。。。所以也没什么好说的。


相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
相关文章
|
22天前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
171 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
22天前
|
存储 关系型数据库 MySQL
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
覆盖索引、前缀索引、索引下推、SQL优化、EXISTS 和 IN 的区分、建议COUNT(*)或COUNT(1)、建议SELECT(字段)而不是SELECT(*)、LIMIT 1 对优化的影响、多使用COMMIT、主键设计、自增主键的缺点、淘宝订单号的主键设计、MySQL 8.0改造UUID为有序
MySQL高级篇——覆盖索引、前缀索引、索引下推、SQL优化、主键设计
|
14天前
|
SQL 存储 索引
SQL Server的Descending Indexes降序索引
【9月更文挑战第21天】在SQL Server中,降序索引允许指定列的排序顺序为降序,可显著优化涉及降序排序的查询性能,特别是在复合索引中。通过创建降序索引,可以更高效地满足特定业务需求,如按交易时间降序获取最新记录。然而,使用时需考虑查询频率、数据分布及维护成本,以确保最佳性能。
|
9天前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
2月前
|
SQL 分布式计算 MaxCompute
一种基于ODPS SQL的全局字典索引分布式计算思路
本文提供一种能充分利用分布式计算资源来计算全局字典索引的方法,以解决在大数据量下使用上诉方式导致所有数据被分发到单个reducer进行单机排序带来的性能瓶颈。
|
3月前
|
SQL 关系型数据库 分布式数据库
PolarDB产品使用问题之相同的SQL语句在不同时间执行EXPLAIN计划显示出不同的索引类型,是什么原因
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
PolarDB产品使用问题之相同的SQL语句在不同时间执行EXPLAIN计划显示出不同的索引类型,是什么原因
|
2月前
|
SQL 存储 数据库
|
2月前
|
存储 SQL 数据库
|
2月前
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
137 0
|
2月前
|
SQL 关系型数据库 MySQL
SQL索引构建与优化的神奇之处:如何用高效索引让你的数据检索飞起来?
【8月更文挑战第31天】在现代软件开发中,数据库索引对于提升查询性能至关重要。本文详细介绍了SQL索引的概念、构建方法及优化技巧,包括避免不必要的索引、使用复合索引等策略,并提供了实用的示例代码,如 `CREATE INDEX index_name ON table_name (column_name, another_column_name);`。通过遵循这些最佳实践,如了解查询模式和定期维护索引,可以大幅提高数据检索效率,从而增强应用程序的整体性能。
79 0
下一篇
无影云桌面