下面是对LevelDB、TreeDB、SQLite3 这几个数据库的性能对比测试,分别使用了LevelDB (revision 39) SQLite3 (version 3.7.6.3) 及 Kyoto Cabinet’s (version 1.2.67)这三个版本的数据库。 测试机器配置:six-core Intel(R) Xeon(R) CPU X5650 @ 2.67GHz, with 12288 KB of total L3 cache and 12 GB of DDR3 RAM at 1333 MHz 文件系统:测试脚本分别跑在两台机器上,其文件系统一台为ext3(磁盘为 SATA Hitachi HDS721050CLA362),一台为ext4(配备磁盘 SATA Samsung HD502HJ) 性能测试源码:
基本测试
基本测试的条件如下:
- 每个数据库使用4GB内存
- 数据库都处于异步写模式(LevelDB’s sync option, TreeDB’s OAUTOSYNC option, SQLite3’s synchronous options 都关闭),也就是说写操作不用等数据真正写到磁盘上才返回。
- Key 的长度为16字节
- Value 的长度为100字节 (这个长度才能让数据库的压缩算法能够起作用,将数据压缩至50%大小左右)
- 顺序读写时Key值递增变化
- 随机读时生成随机的Key值
测试结果:
结果显示,在顺序读写和随机写上,LevelDB 在性能上都遥遥领先,在随机读上面 Kyoto Cabinet 引擎稍快一些。 在几种不同策略下进行写操作测试
A. Values 为长数据(数据长度为100,000字节)
LevelDB在Value较长时性能比较低,这是由于LevelDB对每一次写操作都会至少进行两次写动作,一次是写数据文件,另一次是写日志文件。这里慢的主要原因是LevelDB在进行这些操作时对值进行了过多的Copy。
B. 批量写操作
一次写操作写1000条100字节的数据,由于TreeDB不支持批量写入,故未对其进行对比测试
上面结果是由于LevelDB数据的组织方式,导致顺序写和随机写在性能上都变化不大。
C. 同步进行写操作
- 对 LevelDB, 设置 WriteOptions.sync = true.
- 对 TreeDB, 将 TreeDB’s OAUTOSYNC 选项开启.
- 对 SQLite3, 设置 “PRAGMA synchronous = FULL”.
如果你看一下ext4文件系统下的测试数据,你会发现ext3和ext4在表现上非常不同。
D. 无压缩的写操作
LevelDB 和 TreeDB 都支持相应的数据压缩算法(LevelDB 使用的是
Snappy , TreeDB 使用的是
LZO),由于SQLite不支持压缩,所以这里的测试数据只是从上面的基本测试结果copy过来的。
LevelDB开启压缩比不开启压缩效率更高,而TreeDB则相反,这可能是由于TreeDB采用的压缩算法(LZO)与LevelDB采用的压缩算法(Snappy)相比计算代价更高。
E. 使用更大内存
将每个独立库的内存增大到128MB,对LevelDB来说,其中120MB用来做 write buffer,另外8MB用来做 cache(原来是2MB的 write buffer 和2MB的cache),对SQLite来说,我们不改变其page size,还是保持为1kb,但是我们增大其page数量从4k增加到128k,对TreeDB来说,我们同样不改变其page大小,也只是增大其 cache,从4MB增大到128MB。
SQLite 在采用了大内存后性能变化并不大,而 LevelDB 和 TreeDB 的随机写性能却有显著提高。LevelDB 在增大内存后性能提升的原因是其write buffer 更大,从而减少了创建的sorted file的次数。减少了磁盘IO。而 TreeDB 的性能提升原因是由于其数据库的更大部分被映射到内存中了。
在几种不同策略下进行读操作测试
A. 大的Cache空间
我们分配128MB给每个数据库,对LevelDB来说,我们分配8MB给 write buffer,120MB给cache,对另外两个数据库,由于它们不支持区分 write buffer 和cache,所以统一将 cache size设置成128MB。
从结果可以看到,增大Cache在数据库读性能上都有所提升,其中最为显著的是TreeDB,其随机读性能大幅提升。主要是由于有足够的内存使得其所有读操作都几乎是在内存中进行。
B. 无压缩的读操作
下面结果是我们对预先无压缩状态写入的100万条key为16字节、value为100字节的数据后进行的读性能测试。同样的 SQLite 由于不支持压缩,所以下面数据是直接从其基本测试上copy过来的。
结果可以看到,取消压缩对读取性能提升不是特别大,当然,如果你的数据都在内存中的话,执行解压操作也不会对性能造成太大影响。 原文:
leveldb.googlecode.com 译文:
http://blog.nosqlfan.com/html/2819.html -*-*-