Tair是为了解决什么问题而生?
Redis很好用,相比memcached多了很多数据结构,支持持久化。但是在很长一段时间里,原生是不支持分布式的。后来就出现了很多redis集群类产品,Tair是其中胜出的优秀作品之一。
所以Tair的特性都是一些集群的特性,比如:容错、解决单点故障、跨机房管理、多集群管理、支持副本等。总而言之,是redis的高可用版本。
Tair的架构
Tair的整体风格是简约实用,包括三个必选模块:client、configserver和dataserver。
一个可选模块:invalidserver。还有一个必要软设施:一致性哈希算法提供分布式的负载均衡计算。
client的作用
1. 在应用端提供访问Tair集群的接口
2.更新并缓存数据分布表和invalidserver 地址等
3. 本地缓存,避免过热数据访问影响Tair集群服务
4. 流控
configserver的作用
1. 通过维护和dataserver心跳来获取集群存活节点的信息
2.通过存活节点的信息来构建数据在集群中的分布表
3. 提供数据分布表的查询服务
4. 调度dataserver之间的数据迁移、复制
dataserver的作用
1. 提供存储引擎
2. 接受client和put、get、remove等操作
3. 执行数据迁移、复制等
4. 插件:在接受请求的时候处理一些自定义功能
5. 访问统计
invallidserver的作用
1. 接收来自client和invalid、hide等请求后,对属于同一组的集群(双机房独立集群部署方法)做delete、hide操作,保证同一组集群的一致
2.集群断网之后的脏数据清理
3. 访问统计
一致性哈希的作用
1. 增加和减少dataserver的时候,进行rehash重哈希。并在迁移过程中保持原数据对外提供服务
2. 负载均衡,并行多个key进行计算合并结果(mget)
Tair的使用场景
- 缓存
- 分布式锁
- 作为nosql数据库,提供简单类型存储(K/V存储,无复杂查询)
Tair使用QA
1.
Q:tair可以支持支持什么类型?
A:内部是序列化成二进制的,就是说理论上支持任何类型。
2.
Q:tair有mget的功能可以一次性返回多个结果,这个个数有上限吗?
A:理论上没有。实际使用中建议1次在100个以下。因为多个请求要等所有的结果回来再进行聚合。聚合等待太多,错误就会发生。好比一个机器故障率是万分之一。那么10000条记录一起请求结果,那么故障率就非常高了,可能多数情况下都是失败的。
3.
Q:tair的分布式锁使用有什么最佳实践?
A:分布式锁使用建议使用带有过期时间的分布式锁,过期时间可传一个绝对的时间戳。解锁时可传入一个非常大的整数,以解掉所有的锁。