String
是 Redis
中最常见的数据存储类型:
- 其基本编码方式是
RAW
,基于简单动态字符串(SDS)实现,存储上限为512mb
。
- 如果存储的SDS长度小于44字节,则会采用
EMBSTR
编码,此时 object head 与 SDS是一段连续空间。申请内存时只需要调用一次内存分配函数,效率更高。
- 如果存储的是整数数值, 并且大小在
LONG_MAX
范围内, 则采用INT
编码,直接将数据保存在 RedisObject 中的 ptr指针位置 (刚好8字节), 不再需要 SDS 了.
三种编码方式一览:
(1)底层实现⽅式:动态字符串sds 或者 long
String 的内部存储结构⼀般是 sds(Simple Dynamic String,可以动态扩展内存),但是如果⼀个String 类型的 value 的值是数字,那么 Redis 内部会把它转成 long 类型来存储,从⽽减少内存的使用。
如果存储的字符串是整数值,并且大小在 LONG_MAX 范围内,则会采用 INT 编码:直接将数据保存在RedisObject的ptr指针位置(刚好8字节),不再需要SDS了。
下面的都是废话,不看也罢.
确切地说,String 在 Redis 中是⽤⼀个 robj 来表示的。
用来表示String的robj可能编码成3种内部表⽰:OBJ_ENCODING_RAW,OBJ_ENCODING_EMBSTR,OBJ_ENCODING_INT。
其中前两种编码使⽤的是sds来存储,最后⼀种OBJ_ENCODING_INT编码直接把string存成了long型。
在对string进行incr, decr等操作的时候,如果它内部是OBJ_ENCODING_INT编码,那么可以直接行加减操作;如果它内部是OBJ_ENCODING_RAW或OBJ_ENCODING_EMBSTR编码,那么Redis会先试图把sds存储的字符串转成long型,如果能转成功,再进行加减操作。对⼀个内部表示成long型的string执行append, setbit, getrange这些命令,针对的仍然是string的值(即⼗进制表示的字符串),而不是针对内部表⽰的long型进⾏操作。比如字符串”32”,如果按照字符数组来解释,它包含两个字符,它们的ASCII码分别是0x33和0x32。当我们执行命令setbit key 7 0的时候,相当于把字符0x33变成了0x32,这样字符串的值就变成了”22”。⽽如果将字符串”32”按照内部的64位long型来解释,那么它是0x0000000000000020,在这个基础上执⾏setbit位操作,结果就完全不对了。因此,在这些命令的实现中,会把long型先转成字符串再进行相应的操作。
String 类型数据在 Redis 中的底层表示涉及到两个关键概念:编码方式和底层实现结构。下面详细介绍一下这两个方面:
编码方式
在 Redis 中,String 类型数据可以采用不同的编码方式,主要包括 int 编码和 raw 编码。
- int 编码:
- 当字符串类型的数据可以被解释为整数时,Redis 会将其编码为 int 类型,以节省内存空间和提高操作效率。
- 在 int 编码中,字符串被解释为整数,ptr 指向的是一个 long 类型的整数。
- 这种编码方式适用于能够被转换为整数的字符串,比如 “123”。
- int 编码的优势在于节省存储空间和提高计算效率,但不适用于无法转换为整数的字符串。
- raw 编码:
- 当字符串类型的数据无法被解释为整数时,Redis 会采用 raw 编码,直接存储字符串的原始内容。
- 在 raw 编码中,ptr 指向的是一个字符数组,存储了字符串的原始内容。
- 这种编码方式适用于任意类型的字符串,比如 “hello”。
- raw 编码的优势在于能够存储任意类型的字符串,但相比于 int 编码可能会占用更多的存储空间和执行效率。
底层实现结构
String 类型数据的底层实现结构主要依赖于 SDS(Simple Dynamic Strings)和 int 编码。
- SDS(Simple Dynamic Strings):
- SDS 是 Redis 中用于表示字符串对象的底层实现之一,它是一种动态字符串结构,旨在提供更灵活、高效的字符串操作。
- SDS 的主要特点包括动态扩展、空间预分配、二进制安全、缓冲区结构和修改操作效率高等。
- SDS 在处理动态字符串时更加方便和高效,因为它不必像传统的 C 字符串那样需要手动管理内存空间的分配和释放。
- int 编码:
- 当字符串可以被解释为整数时,Redis 会使用 int 编码,将其作为一个 long 类型的整数存储。
- 这种方式节省了额外的存储空间,并提高了对整数类型数据的操作效率。
在实际使用中,Redis 会根据字符串的内容和操作的情况自动选择合适的编码方式和底层实现结构,以达到节省空间和提高效率的目的。这种动态的选择机制使得 Redis 能够灵活地处理不同类型的字符串数据,并在存储和操作上保持高效性。