Memcache持久性分布式数据MemcacheDB

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

转载自:http://blog.csdn.net/zhu_tianwei/article/details/44860129

 

Memcachedb 是新浪网基于Memcached(源代码是基于Memcached。)开发的一个分布式的Key-Value存储持久化开源项目。通过为 Memcached增加Berkeley DB的持久化存储机制和异步主辅复制机制,使Memcached具备了事务恢复能力、持久化能力和分布式复制能力,非常适合需要超高性能读写速度、持久化 保存的应用场景,例如,将memcachedb应用于新浪博客的管理。如果对Memcached有持久化需求,可以考虑使用memcachedb。

 

特点:

1.高性能的key-value的读/写

2.高可靠的持久化存储与交易

3.高性能的数据存储与复制

4.Memcahce协议

 

官网地址:

http://memcachedb.org/

 

项目地址:

http://code.google.com/p/memcachedb/

https://github.com/mplatov/memcachedb

 

一、应用场景


从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。

 

数据存储系统 检索 持久 并发 硬件要求 扩展
MySQL 高cpu/硬盘/内存 主从/主主
memcachedb 高硬盘,低cpu/内存 主从
memcached 高内存,低cpu 依靠客户端分布

 

memcached因为是非持久存储的,所以它的定位就是缓存。 而 memcachedb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,memcachedb性能要比mysql高,而mysql检索功能 比memcachedb强。如果非要从缓存的角度看的话,那memcached就是缓解mysql读压力,而memcachedb则是缓解mysql写压力。


memcachedb适合应用的场景:   
1.浏览/点击/等统计,也可以局部代替mysql的count函数    
2.标志,例如,JE的“我在干什么”功能    
3.频繁写的地方,访客列表、评论之类的

 

二、安装


安装MemcacheDB之前需要安装Libevent和Berkeley Db

 

1.先安装libevent

下载地址: http://www.monkey.org/~provos/libevent/

1
2
3
4
5
6
wget http: //jaist .dl.sourceforge.net /project/levent/libevent/libevent-2 .0 /libevent-2 .0.22-stable. tar .gz
tar  -zxvf libevent-2.0.22-stable. tar .gz
cd  libevent-2.0.22-stable
. /configure  --prefix= /home/slim/libevent
make
make  install

 

2.安装Berkeley Db  (使用root安装)

MemcacheDB 1.2.0 is released, for BerkeleyDB 4.7,所以需要下载 BerkeleyDB 4.7版本   
下载地址:http://www.oracle.com/technetwork/database/database-technologies/berkeleydb/downloads/index.html

1
2
3
4
5
6
7
wget http: //download .oracle.com /berkeley-db/db-4 .7.25. tar .gz
tar  -zxvf db-4.7.25. tar .gz
cd  db-4.7.25
cd  build_unix/
.. /dist/configure
make
make  install

安装完后,编辑/etc/ld.so.conf将Berkeley+Db运行库的路径添加到系统配置里面

1
2
3
echo  "/usr/local/BerkeleyDB.4.7/lib/"  >>  /etc/ld .so.conf
#重载系统Ld运行库
ldconfig

 

3.安装memcachedb

下载地址:http://code.google.com/p/memcachedb/downloads/list    

1
2
3
4
5
tar  -zxvf memcachedb-1.2.0. tar .gz  
cd  memcachedb-1.2.0/    
. /configure  -- enable -threads  --prefix= /home/slim/memcachedb  --with-libevent- dir = /home/slim/libevent
make   
make  install


检查安装:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
. /bin/memcachedb  -h
memcachedb 1.2.0
-p <num> TCP监听端口,默认是 21201
-U <num> UDP监听端口,默认是 0,也就是关闭。
-s < file > 使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用
-a <mask> unix socket文件的权限,默认是 0700
-l <ip_addr> 监听地址,默认是 INDRR_ANY
-d 以守护进程方式运行
-r maximize core  file  limit
-u <username> 以<username>启动,只有root才能使用,因为memcachedb不允许以root启动
-c <num> max simultaneous connections, default is 1024
-b <num> item size smaller than <num> will use fast memory alloc, default is 512B
- v  打印错误和警告信息
-vv 打印整个交互过程
-h print this help and  exit
-i print license info
-P < file > 进程PID保存路径,只能在守护进程方式下使用
-t <num> 线程数,默认是4
--------------------BerkeleyDB Options-------------------------------
-m <num>  in -memmory cache size of BerkeleyDB  in  megabytes, default is 64MB
-A <num> underlying page size  in  bytes, default is 4096, (512B ~ 64KB, power-of-two)
-f < file > 数据文件名, 默认是  'data.db'
-H < dir > 数据保存目录,默认是  '/data1/memcachedb'
-B <db_type> 数据结构类型,有  'btree'  和  'hash' 两种. 默认是  'btree'
-L <num> log buffer size  in  kbytes, default is 32KB
-C <num> 每隔多少秒checkpoint, 设置为0将实时写入硬盘, 默认是5分钟
-T <num>  do  memp_trickle every <num> seconds, 0  for  disable, default is 30 seconds
-e <num> percent of the pages  in  the cache that should be clean, default is 60%
-D <num>  do  deadlock detecting every <num> millisecond, 0  for  disable, default is 100ms
-N 设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭
--------------------Replication Options-------------------------------
-R 主服务器提供同步数据的地址和端口,主从模式必须设置
-O 从服务器同步源地址和端口
-M /-S  以主或从服务器启动
-n 允许从服务器数量, 默认是2台
-----------------------------------------------------------------------

关于-C和-N选项涉及到数据完整性,会在下面会说明一下


注意:

若报错“./bin/memcachedb: error while loading shared libraries: libevent-2.0.so.5: cannot open shared object file: No such file or directory”.


将libevent库的路径添加到系统配置里面

1
2
echo  "/home/slim/libevent/lib"  >>  /etc/ld .so.conf
ldconfig

 

4.创建数据保存点

1
2
cd  ~ /memcachedb
mkdir  data /11211  –p

 

四、使用


1.单机模式

1
. /bin/memcachedb   -p 11211  -d -r -H   /home/slim/memcachedb/data/11211  - v  >> /home/slim/memcachedb/data/11211 .log 2>&1

 

2.主从模式

1
. /bin/memcachedb   -p 11211  -d -r -H   /home/slim/memcachedb/data/11211  -N -R 192.168.13.102:11200 -M

主服务器,用11200来同步数据

1
. /bin/memcachedb   -p 11311  -d -r -H   /home/slim/memcachedb/data/11311  -N -R 192.168.13.102:11300 -O  192.168.13.102:11200 -S

从服务器,主从模式-R是必须设置的。

从服务器不能储存数据。

 

3.测试是否同步

1
2
3
4
5
6
7
8
9
10
11
12
13
# telnet 192.168.13.102 11211
set  yy 0 0 4
yyyy
STORED
get yy
VALUE yy 0 4
yyyy
END
#telnet 192.168.13.102 11311
get yy
VALUE yy 0 4
yyyy
END

 

五、备份和恢复

 

1.热备份

因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份   

1
[root@srv willko] # /usr/local/BerkeleyDB.4.7/bin/db_hotbackup -h /data/21201/ -b ./bak/

  
-h是数据的目录    
-b是备份的目录    
恢复的话,启动memcacedb的数据目录设置成备份目录就可以了


2.单机模式crash恢复

bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。   

1
/usr/local/BerkeleyDB .4.7 /bin/db_recover  -cf -h  /data/21201/

-h是你的数据目录


3.模拟crash

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#./bin/memcachedb -p 11211 -d -r -H /home/slim/memcachedb/data/11211 -v >>/home/slim/memcachedb/data/11211.log 2>&1 -P /home/slim/memcachedb/data/11211 .pid
# telnet 192.168.13.102 11211
set  t 0 0 4
hhhh  #设置键为t,值为hhhh的
STORED
get t
VALUE t 0 4
hhhh
END
quit
Connection closed by foreign host.
# kill -9 `cat /home/slim/memcachedb/data/11211 .pid ` #用-9来模拟crash
# /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /home/slim/memcachedb/data/11211
recovery 100% complete
# ./bin/memcachedb -p 11211 -d -r -H /home/slim/memcachedb/data/11211 -v >>/home/slim/memcachedb/data/11211.log 2>&1 -P /home/slim/memcachedb/data/11211 .pid
# telnet 192.168.13.102 11211
get t
VALUE t 0 4
hhhh  #还可以获得crash前设置的值
END

 

4.主从模式的crash恢复

主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。 但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。 也就是说使用-N选项后,crash后通过slave来恢复。


参考文章

Memcachedb使用手册

Memcachedb介绍、编译以及安装

轻量级持久存储系统 MemcacheDB

Memcachedb百度百科

Memcachedb的缓存解决方案(nginx小文件缓存)
















本文转自UltraSQL51CTO博客,原文链接:http://blog.51cto.com/ultrasql/1642109 ,如需转载请自行联系原作者


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
27天前
|
消息中间件 算法 Java
【亿级数据专题】「分布式服务框架」 盘点本年度我们探索服务的保障容量的三大关键方案实现
【亿级数据专题】「分布式服务框架」 盘点本年度我们探索服务的保障容量的三大关键方案实现
185 0
|
3月前
|
存储 缓存 NoSQL
【分布式】Redis与Memcache的对比分析
【1月更文挑战第25天】【分布式】Redis与Memcache的对比分析
|
3月前
|
消息中间件 算法 Java
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的保障容量的三大关键方案实现
尽管经过了上一篇文章 《【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现》有了低延迟的优化保障,消息引擎仍需精心规划其容量。为了提供无与伦比的流畅体验,消息引擎必须实施有效的容量管理策略。
52 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的保障容量的三大关键方案实现
|
2月前
|
消息中间件 存储 负载均衡
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案
昔之善战者,先为不可胜,以待敌之可胜。不可胜在己,可胜在敌。故善战者,能为不可胜,不能使敌之必可胜。故曰:胜可知,而不可为。
80 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案
|
3月前
|
消息中间件 存储 Java
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现
在充满挑战的2023年度,我们不可避免地面对了一系列棘手的问题,例如响应速度缓慢、系统陷入雪崩状态、用户遭受不佳的体验以及交易量的下滑。这些问题的出现,严重影响了我们的业务运行和用户满意度,为了应对这些问题,我们所在团队进行了大量的研究和实践,提出了低延迟高可用的解决方案,并在分布式存储领域广泛应用。
43 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现
|
9月前
|
存储 负载均衡 容灾
MySQL数据库的分布式架构和数据分片方案
MySQL数据库的分布式架构和数据分片方案
|
5月前
|
Java
分布式系列教程(24) -Zookeeper数据查看工具ZooInspector
分布式系列教程(24) -Zookeeper数据查看工具ZooInspector
79 0
|
3月前
|
存储 NoSQL 算法
redis存储什么类型的数据?redis分布式锁怎么实现的?
redis存储什么类型的数据?redis分布式锁怎么实现的?
|
4月前
|
消息中间件 存储 算法
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
78 0
|
4月前
|
存储 关系型数据库 MySQL
存储成本最高降至原来的5%,PolarDB分布式冷数据归档的业务实践
国内某家兼具投资理财、文化旅游、票务为一体的大型综合型集团公司,2015年成立至今,由于业务高速发展,业务数据增长非常快,数据库系统屡次不堪重负。该公司数据库运维总监介绍,他们目前业务压力比较大的是票务和订单系统,他们的平台每天新增几千万的订单数据,订单的数据来自于各个终端,近几年每个月以300G的数据规模在高速增长,由于数据不断增加,数据库系统迄今为止迭代过了3次。

热门文章

最新文章