一、问题来源
如果我们查看show egnine innodb查看锁记录的时候往往会看到Innodb的数字使用类似
80000001的形式显示如下:
这里是一个有符号的bigint的显示。本文就来说一下这个值是这么计算出来的。本文以4字节的int为例。
二、源码部分
关于转换的部分主要集中在函数 row_mysql_store_col_in_innobase_format
中,我们来看一下数字的转换代码如下:
if (type == DATA_INT) {
/* Store integer data in Innobase in a big-endian format,sign bit negated if the data is a signed integer. In MySQL,
integers are stored in a little-endian format. */
//p指针指向buf的最高地址,反向获取数据得到大端buffer时
byte* p = buf + col_len;
for (;;) {
p--;
p = mysql_data; //转大端
if (p == buf) { //如果存储完成
break;
}
mysql_data++;
}
if (!(dtype->prtype & DATA_UNSIGNED)) {//如果为有符号类型
*buf ^= 128;
}
ptr = buf; //PTR指向 buffer低地址
buf += col_len;//buf指向 buffer的高地址
}
...
//存入dtuple中,里面很简单就是取void* 存进去进行了。
dfield_set_data(dfield, ptr, col_len);
这里的关键部分就是对于有 *buf ^= 128
这部分,实际上就是转换为大端后的最低位做一个异或操作。
最终操作为函数 page_cur_tuple_insert
会将这个dtuple插入到实际的数据文件其中有一个函数为 rec_convert_dtuple_to_rec_comp
,会获得最终的物理记录,其中的代码memcpy(end, dfield_get_data(field), len)
,可以看到实际存入物理记录的就是这里的转换后的值。
三、实例解析
1. 有符号
正数:以数字5为例子,其4字节的表示方法为0x05 0x00 0x00 0x00
,这里还是小端形式为MySQL层传入的值。Innodb转换方式如下:
- 从高地址开始取,转换为大端形式,转换后为
0x00 0x00 0x00 0x05
- 如果为有符号类型转换为大端后的最低位做一个异或操,转换为
0x80 0x00 0x00 0x05
负数:以数字-5为例子,其4字节的表示方法为0xfb 0xff 0xff 0xff
(补码),这里还是小端形式为MySQL层传入的值。Innodb转换方式如下:
- 从高地址开始取,转换为大端,转换后为
0xff 0xff 0xff 0xfb
- 如果为有符号类型转换为大端后的最低位做一个异或操,转换为
0x7f 0xff 0xff 0xfb
2、无符号
这个比较简单,直接原始值大端输出即可,不做最后的异或操作。
四、测试
我们为了测试就建立一个表如下:
create table testint(id int primary key);
insert into testint values(5),(-5);
然后使用innblock和bcview查看二进制文件中存储的方式。
第一行记录为:
转换如下:
80000005 实际记录5
000000014224 trx id
bd000000230110 roll ptr
第二行记录为:
7ffffffb 实际记录-5
000000014224 trx id
bd00000023011d roll ptr
我们可以发现我们的分析是正确,确实物理文件中也是这样存储的。
</div>