初识SDS:
Redis的String和其他很多编程语言中的语义相似,它能够表达3种值的类型:
1.字符串
2.整数
3.浮点数
三种类型根据具体场景由Redis完成相互之间的自动转换,并且根据需要选取底层的承载方式,Redis内部,String类型的value是用int,SDS作为结构存储。int用来存放整型数据,SDS存放字节/字符串和浮点型数据。相较于C的标准字符串,SDS封装了更多的信息以提升基本操作的性能,同时充分利用已有的C的标准库,简化实现。
Redis也支持使用C语言的传统字符串,只不过会用在一些不需要对字符串修改的地方,比如静态的字符输出,而我们开发中使用Redis,往往会经常性的修改字符串的值,这个时候就会用SDS来表示字符串的值了。
在redis数据库中,K-V键值对含有字符串值的,都是由SDS来实现的。
一个SDS值的数据结构,主要由len,free,buf[]这三个属性组成
struct sdshdr{ int free;//buf[]数组未使用字节的数量 int len;//buf[]数组所保存的字符串的长度 char buf[];//保存字符串的数组 }
其中buf[]为实际保存字符串的char类型数组;free表示buf[]数组未使用字节的数量
,len表示buf[]数组所保存的字符串长度
,并且SDS会以\0结尾,\0在Redis实现中仅作为字符串的定界符。
Redis为什么要这样设计呢?
效率高:
工作中使用Redis,经常会通过strlen命令得到一个字符串的长度,在 SDS结构中len属性记录了字符串的长度,所以我们获取一个字符串长度直接取len的值,复杂度是O(1)
而如果用C字符串,在获取一个字符串长度时,需对整个字符串进行遍历,直至遍历到空格符结束(C中遇到空格符代表一个完整字符串),此时的复杂度是O(N)
在高并发场景下频繁遍历字符串,获取字符串的长度很有可能成为redis的性能瓶颈,所以SDS性能更好一些
防止数据溢出:
C字符串是不记录自身长度的
,相邻的两个字符串存储的方式可能是挨着的,为字符串分配了合适的内存空间
。如果我想更改字符串,改长了的话,没办法放下只能侵占相邻字符串的空间,自身数据溢出导致其他字符串的内容被修改。
//原始字符串: 从未止步\0从未止步\0 //自身数据溢出 从未止步\0未止步\0
而SDS很好的规避了这点,当我们需要修改数据时,首先会检查当前SDS空间len是否满足,不满足则自动扩容空间至修改所需的大小,然后再执行修改
空间预分配:
空间预分配策略用于优化SDS字符串增长操作,当修改字符串并需对SDS的空间进行扩展时,不仅会为SDS分配修改所必要的空间,还会为SDS分配额外的未使用空间free,下次再修改就先检查未使用空间free是否满足,满足则不用在扩展空间。
通过空间预分配策略,Redis可以有效的减少字符串连续增长操作,所产生的内存重分配次数。
额外分配未使用空间 free 的规则:
如果对 SDS 字符串修改后,len值小于 1M,那么此时额外分配未使用空间 free 的大小与 len相等
如果对 SDS 字符串修改后,len值大于等于 1M,那么此时额外分配未使用空间 free 的大小为 1M
惰性空间释放
惰性空间释放策略则用于优化SDS字符串缩短操作,当缩短SDS字符串后,并不会立即执行内存重分配来回收多余的空间,而是用 free属性将这些空间记录下来,因此在redis中,修改字符串是一个很常见的操作,因此如果后续有增长操作,则可直接使用。
//后面的0不会被立即回收,而是使用free属性记录下来 从未止步\00 //增长字符串---直接使用0的那个空间 从未不止步\0