SQL Server计算数据库中表、堆、聚集索引和非聚集索引的大小

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介:

前言

在前篇的一篇博客Sql Server中的表组织和索引组织(聚集索引结构,非聚集索引结构,堆结构)中写到了数据中表和索引的结构。当时在写聚集索引的时候说聚集索引的叶子节点就是真实的数据,而非聚集索引的叶子节点是指针,要么指向聚集索引,要么指向行号。当时就在考虑一个,如果索引都带真实数据了,那么到底是索引大还是表呢呢?

今天在msdn上查到了如何估算数据库的大小,其中在估算表的大小时,给出了如下说明:

可以使用下列步骤估计在表中存储数据所需的空间:

  1. 按照估计堆的大小估计聚集索引的大小中的说明计算堆或聚集索引所需的空间。
  2. 对于每个非聚集索引,按照估计非聚集索引的大小中的说明计算其所需的空间。
  3. 对步骤 1 和步骤 2 中计算的值求和。

这就说明了表其实包含索引跟数据两部分,索引是建立在表上的。之前一直将数据跟表分割了,所以才产生开头提到的问题。现在算是明白了。那么又有新的问题了,索引跟数据,哪个大?

计算堆的大小

我们通过以下的一个小实验来计算数据在堆结构中的存储方式。

复制代码
use TESTDB1
go
--step1:创建表
CREATE TABLE Orders2
(
  orderid        INT,--4字节
  orderdate      DATETIME, --8字节
  freight        MONEY,--8字节
  shipname       NCHAR(40),--double-byte存储,40*2=80字节
  shipcountry    CHAR(15) --single-byte存储,15字节
);
go
--step2:计算列大小
--原先的计算这张表的列大小为:4+8+8+80+15=115字节,一页能够存储8060/115=70.08,取整为70行数据
/*
按照http://msdn.microsoft.com/zh-cn/library/ms189124.aspx的方法计算
Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
Fixed_Data_Size=4+8+8+80+15=115
Variable_Data_Size=0,
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
Row_Size=115+0+3+4=122
Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(122+2)=8060/124=65
*/
--step3:查看表存储信息
select * from Orders2;
--未插入数据前,查询全部都是0
exec sp_spaceused Orders2

--step4:插入一条记录
INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
  VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
select * from Orders2;

--step5:再次查看表存储信息
--插入数据以后,data=8kb,index=8kb。8kb是最小的IO单位,即使只有一行,也是8kb。
exec sp_spaceused Orders2

--step6:前面插入了一行数据,我们之前算过一页能存65行,下面我们插入60行,然后再一条一条递增。看一下是不是还是8kb
--循环插入60条记录
declare @i int 
set @i=1 
while @i<=60
  begin 
    INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
    set @i = @i + 1
  end

--step7:查看表存储信息,查询结果还是data=8kb,index=8kb
select * from Orders2;
exec sp_spaceused Orders2

--step8:再次插入一条记录,直到rows=64时,data=16kb,表示数据占用两个page了,
--按照计算应该是65.刚刚满页.这是否表明页不能存满,存满马上分页.
 INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  N'France');
--step9:
exec sp_spaceused Orders2
复制代码

疑问:按照计算,一页刚刚好能够存65条记录,但是在存到64页的时候就占用16kb,也就是两页了,这是为什么?是否表明数据不能满页。

将上述

 shipcountry    CHAR(15)

修改为

 shipcountry    CHAR(20)

那么按照公式计算如下

复制代码
/*
Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
Fixed_Data_Size=4+8+8+80+20=120
Variable_Data_Size=0,
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
Row_Size=120+0+3+4=127
Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(127+2)=8060/129=62.4
*/
复制代码

上述公示表明我一页能够存储62行,但是在我插入了60行数据的时候data=8kb,但是当rows=61的时候,data=16kb了。



 本文转自xwdreamer博客园博客,原文链接:http://www.cnblogs.com/xwdreamer/archive/2012/07/12/2588761.html,如需转载请自行联系原作者

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
14天前
|
SQL 索引
【YashanDB知识库】字段加上索引后,SQL查询不到结果
【YashanDB知识库】字段加上索引后,SQL查询不到结果
|
4天前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
● B+树更便于遍历:由于B+树的数据都存储在叶子结点中,分支结点均为索引,方便扫库,只需要扫一遍叶子结点即可,但是B树因为其分支结点同样存储着数据,我们要找到具体的数据,需要进行一次中序遍历按序来扫,所以B+树更加适合在区间查询的情况,所以通常B+树用于数据库索引。 ● B+树的磁盘读写代价更低:B+树在内部节点上不包含数据信息,因此在内存页中能够存放更多的key。 数据存放的更加紧密,具有更好的空间局部性。因此访问叶子节点上关联的数据也具有更好的缓存命中率。 ● B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条
|
24天前
|
SQL 数据库
数据库数据恢复—SQL Server报错“错误 823”的数据恢复案例
SQL Server数据库附加数据库过程中比较常见的报错是“错误 823”,附加数据库失败。 如果数据库有备份则只需还原备份即可。但是如果没有备份,备份时间太久,或者其他原因导致备份不可用,那么就需要通过专业手段对数据库进行数据恢复。
|
25天前
|
SQL 关系型数据库 OLAP
云原生数据仓库AnalyticDB PostgreSQL同一个SQL可以实现向量索引、全文索引GIN、普通索引BTREE混合查询,简化业务实现逻辑、提升查询性能
本文档介绍了如何在AnalyticDB for PostgreSQL中创建表、向量索引及混合检索的实现步骤。主要内容包括:创建`articles`表并设置向量存储格式,创建ANN向量索引,为表增加`username`和`time`列,建立BTREE索引和GIN全文检索索引,并展示了查询结果。参考文档提供了详细的SQL语句和配置说明。
36 1
|
1月前
|
SQL 存储 关系型数据库
【SQL技术】不同数据库引擎 SQL 优化方案剖析
不同数据库系统(MySQL、PostgreSQL、Doris、Hive)的SQL优化策略。存储引擎特点、SQL执行流程及常见操作(如条件查询、排序、聚合函数)的优化方法。针对各数据库,索引使用、分区裁剪、谓词下推等技术,并提供了具体的SQL示例。通用的SQL调优技巧,如避免使用`COUNT(DISTINCT)`、减少小文件问题、慎重使用`SELECT *`等。通过合理选择和应用这些优化策略,可以显著提升数据库查询性能和系统稳定性。
92 9
|
2月前
|
SQL Java 数据库连接
【潜意识Java】MyBatis中的动态SQL灵活、高效的数据库查询以及深度总结
本文详细介绍了MyBatis中的动态SQL功能,涵盖其背景、应用场景及实现方式。
186 6
|
2月前
|
数据库 Windows
SqlServer数据恢复—SqlServer数据库所在分区损坏的数据恢复案例
一块硬盘上存放的SqlServer数据库,windows server操作系统+NTFS文件系统。由于误操作导致分区损坏,需要恢复硬盘里的SqlServer数据库数据。
|
3月前
|
SQL Oracle 数据库
使用访问指导(SQL Access Advisor)优化数据库业务负载
本文介绍了Oracle的SQL访问指导(SQL Access Advisor)的应用场景及其使用方法。访问指导通过分析给定的工作负载,提供索引、物化视图和分区等方面的优化建议,帮助DBA提升数据库性能。具体步骤包括创建访问指导任务、创建工作负载、连接工作负载至访问指导、设置任务参数、运行访问指导、查看和应用优化建议。访问指导不仅针对单条SQL语句,还能综合考虑多条SQL语句的优化效果,为DBA提供全面的决策支持。
108 11
|
3月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
B+树优化了数据存储和查询效率,数据仅存于叶子节点,便于区间查询和遍历,磁盘读写成本低,查询效率稳定,特别适合数据库索引及范围查询。
70 6
|
3月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。