BIT类型在SQL Server中的存储大小

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介:

对于一般的INT、CHAR、tinyint等数据类型,他们占用的存储空间都是以Byte字节为单位的,但是BIT类型由于只有0和1或者说false和true,这种情况只需要一个Bit位就可以表示了,那么在SQL Server中BIT类型到底占用了多少空间?是不是由一个Bit位来存储的?或者可能是使用一个字节来存储的?

这两个答案都不正确!!!实际上BIT类型占用的空间与BIT类型的列所在表的位置有关,有些情况下BIT占用了一个字节,有些情况下BIT实际占用了几个位(几个BIT类型的列共用一个字节)。下面就来具体分析一下:

1. 单独的BIT类型的列将占用一个字节。所谓单独就是指一个BIT类型的列的左边定长列和右边定长列都不是BIT类型的列。例如这样一个表:

CREATE   TABLE  tt
(
c1 
INT   PRIMARY   KEY ,
c2 
BIT   NOT   NULL ,
c3 
CHAR ( 2 NOT   NULL
)

 

SQL Server在存储表中的数据时先是将表中的列按照原有顺序分为定长和变长(变长就是长度不固定的数据类型,如varchar,nvarchar,varbinary等)两组。在数据页中存储数据时先存储所有定长的数据,然后再存储变长的数据。这里由于c2列的左边是int类型,右边是char类型,都是定长的,而且不是BIT类型,所以c1和c3之间必须留出一个字节来存储c2,虽然c2只用到了其中的一个位。

下面我们来验证一下是否真是如我所说:

(1)插入一行数据:INSERT INTO tt VALUES(1,1,'aa')

(2)找到tt表数据的第一页(也就是刚才插入的这行数据所在页)的文件号和页面号:

SELECT  first_page
FROM  sys.partitions p
INNER   JOIN  sys.system_internals_allocation_units a
ON  p.partition_id = a.container_id
WHERE   OBJECT_ID =   OBJECT_ID ( ' dbo.tt '

 

我这里返回的是0x76 00 00 00 01 00,这里需要反转过来看0x00 01 00 00 00 76。其中前两个字节是文件号,后面的是页面号,所以文件号是1,页面号是118(0x76转换成十进制就是118)

(3)使用DBCC page命令查看该页的内部结构:

DBCC  traceon( 3604 )
DBCC  page(TestDB, 1 , 118 , 3 )  

 

这儿DBCC traceon(3604)表示将页面内容直接输出,TestDB是我创建的tt表所在的数据库,1和118前面已经说了。最后一个是打印选项。0表示只输出页头;1则不会输出所有内容,只是输出有数据的内容;2表示完整的输出这个页的内容,3则和1差不多,但是要每条记录分别列出列的值。以下是输出的需要关注的内容:

00000000:   10000b00 01000000 01616103 0000††††††.........aa...      

关于数据行的具体格式我就不在这里多说了,在《SQL Server 2005技术内幕 存储引擎》中有详细介绍。我们插入的数据从第5个字节开始,是01000000 016161。这儿01000000就是c1,由于是int类型,所以占用4个字节。接下来01就是c2,在这里占用了1字节。再接下来6161就是c3了。

2.多个BIT类型的列之间使用变长数据类型列分开,则去掉变长列,然后看连续的BIT类型列的个数,每列占用一个位,如果多余了8列那就再占用更多的字节。例如创建这样的表:

复制代码
CREATE   TABLE  vtt
(
c1 
BIT   NOT   NULL ,
c2 
VARCHAR ( 5 NOT   NULL ,
c3 
BIT   NOT   NULL ,
c4 
NVARCHAR ( 5 NULL ,
c5 
BIT   NULL ,
c6 
INT   NOT   NULL
)
复制代码

 

这里将变长列筛选出来后就变成了c1、c3、c5、c6,有3个BIT类型列是连续的,所以c1、c3、c5将公用一个字节。接下来就来验证一下:

(1)插入一条示例数据:INSERT INTO vtt VALUES(1,'abc',1,N'xyz',0,1023)

(2)用前面用的SQL语句,同样的方法,找出vtt表的第一页为:0xC00000000100,对应的就是文件号1,页号192

(3)查看该页的内部数据:

00000000:   30000900 03ff0300 00060000 02001500 †0.    .............         
00000010:   1b006162 63780079 007a00†††††††††††††..abcx.y.z. 

插入的数据从第5个字节开始03ff…… 这儿03就是c1、c3、c5的数据,03转换成二进制就是00000011。c1列对应最低位1,c3对应倒数第二位1,c5对应倒数第三位0。接下来的ff就是c6的值1023。后面的就是列数、NULL位图、变长列等,这里是讨论BIT位占用空间的,所以就不讲解后面这些了。

3.一个表中有多个BIT类型的列,其顺序是否连续决定了BIT位是否可以共享一个字节。SQL Server中按照列顺序存储,第一列和最后一列都是BIT数据类型列,不可以共用一个字节。

也就是说下面的表t1和表t2占用的空间是不同的,t1数据占用了7字节,t2数据占用了8字节。


复制代码
CREATE   TABLE  t1
(
c1 
INT   PRIMARY   KEY ,
c2 
BIT   NOT   NULL ,
c3 
BIT   NOT   NULL ,
c4 
CHAR ( 2 NOT   NULL
)

CREATE   TABLE  t2
(
c1 
INT   PRIMARY   KEY ,
c2 
BIT   NOT   NULL ,
c4 
CHAR ( 2 NOT   NULL ,
c3 
BIT   NOT   NULL
)
复制代码

但是在下面的t3和t4表中,由于中间是变长数据类型,所以他们的BIT列占用的数据空间是相同的。

复制代码
CREATE   TABLE  t3
(
    c1 
INT   NOT   NULL ,
    c2 
BIT   NOT   NULL ,
    c3 
VARCHAR ( 2 NOT   NULL ,
    c4 
BIT   NOT   NULL
)
CREATE   TABLE  t4
(
    c1 
INT   NOT   NULL ,
    c2 
BIT   NOT   NULL ,
    c4 
BIT   NOT   NULL ,
    c3 
VARCHAR ( 2 NOT   NULL    
)
复制代码
相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
2月前
|
SQL Java 数据库连接
mybatis使用四:dao接口参数与mapper 接口中SQL的对应和对应方式的总结,MyBatis的parameterType传入参数类型
这篇文章是关于MyBatis中DAO接口参数与Mapper接口中SQL的对应关系,以及如何使用parameterType传入参数类型的详细总结。
39 10
|
2月前
|
SQL 存储 关系型数据库
SQL判断CHAR类型字段不为空的方法与技巧
在SQL查询中,判断一个CHAR类型字段是否不为空是一个常见的需求
|
3月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
4月前
|
SQL 存储 数据库
SQL Server 中的备份类型详解
【8月更文挑战第31天】
75 0
|
4月前
|
SQL 存储 数据库
|
4月前
|
SQL 关系型数据库 数据处理
|
4月前
|
SQL 存储 数据库
SQL中的不同关系类型:深入解析
【8月更文挑战第31天】
74 0
|
6月前
|
SQL 存储 关系型数据库
PolarDB产品使用合集之有的sql里面有自定义存储函数 如果想走列存有什么优化建议吗
PolarDB是阿里云推出的一种云原生数据库服务,专为云设计,提供兼容MySQL、PostgreSQL的高性能、低成本、弹性可扩展的数据库解决方案,可以有效地管理和优化PolarDB实例,确保数据库服务的稳定、高效运行。以下是使用PolarDB产品的一些建议和最佳实践合集。
339 0
|
SQL 存储 Perl
PL/SQL学习笔记_03_存储函数与存储过程
ORACLE 提供可以把 PL/SQL 程序存储在数据库中,并可以在任何地方来运行它。这样就叫存储过程或函数。 存储函数:有返回值,创建完成后,通过select function() from dual;执行 存储过程:由于没有返回值,创建完成后,不能使用select语句,只能使用pl/sql块执行   一.
1237 0
|
5月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
117 13