Terark核心技术
可检索压缩 SeComp (Seekable Compression) 技术
这个技术拥有超高的压缩率(⼀一般在5倍以上), 同时可以直接在压缩的数据上进行定点访问(微秒级), 避免了了传统数据库使用的分块压缩技术固有的缺点
索引技术
我们实现了多种独有的索引技术。其中最关键的是“数据即索引,索引即数据” , 从而节
约了空间,同时并保持甚至提高了性能
存储引擎技术
Terark存储引擎可以便便捷的融入各种数据系统, 为其提供高效的核心存储技术,大幅提升
整个系统的容量和性能
TerarkDB ——高性能、高压缩的存储引擎
一组800G的数据,Terark压缩后只有47.9G,同时Query延迟达到微秒级。使⽤用Terark,只需要1台普通64G内存的服务器器就够了,而用其它数据库可能就需要搭建一个小集群了。
功能丰富:支持丰富数据类型的Schema定义和灵活的索引, 原生支持正则表达式检索
性能强大:TerarkDB的QPS⽐比同类产品提⾼高1〜2个数量级, 降低延迟, 提高吞吐量
容量大成本低:压缩率5倍以上, 极大的降低IO压⼒力力, 提高数据容量, 降低基础设施成本
索引压缩: Succinct Tree
一种能够在接近于信息论下限的空间内来表达对象的技术,通常使用位图来表示,用位图上的rank和select来定位。