开发者社区> 问答> 正文

希望有更详尽的场景化说明

首先是数据量上限,这些数字直接影响架构设计和代码能不能成功运行:
1、单条记录(Row)的kv数量上限,及所有key\value加起来的byte长度上限。这个不给的话,我们就得考虑单条记录1000万个key的情况吗?


2、 所有key的名称集合有没有上限?因为key名称存在大量重复,但会不会有极多的key名称只出现少数几次,导致key名称的集合没有限制?


3、主键值有没有较短的长度限制,因为商品、买家的主键是字符串,但是由于是主键,要是按64K的长度限制去设计的话,缓存也比较麻烦。


再者是一些特定场景不太明确的地方:
1、数据源文件分布是说:三种文件每种都平均分配在三个磁盘吗?比如3G的买家文件,是不是每个磁盘1G?


2、查询可能存在热点,这个概念很模糊,有没有按照某种标准设计测试热点的分布?

展开
收起
windpicker 2016-07-13 14:20:14 3754 0
2 条回答
写回答
取消 提交回答
  • 1、单条记录(Row)的kv数量上限,及所有key\value加起来的byte长度上限。这个不给的话,我们就得考虑单条记录1000万个key的情况吗?
    数据是有限的,这个上限一定存在,但这个上限不会公布。并且我认为是否需要知道上限和你的设计有关,但是不是每个人的设计都需要知晓这个上限。肯定没有1000万个这么多。


    2、 所有key的名称集合有没有上限?因为key名称存在大量重复,但会不会有极多的key名称只出现少数几次,导致key名称的集合没有限制?
    会有某些key只出现过极少的几次,并且这些key可能被查询


    3、主键值有没有较短的长度限制,因为商品、买家的主键是字符串,但是由于是主键,要是按64K的长度限制去设计的话,缓存也比较麻烦。
    主键值小于256字节



    1、数据源文件分布是说:三种文件每种都平均分配在三个磁盘吗?比如3G的买家文件,是不是每个磁盘1G?
    是的,尽量均匀

    2、查询可能存在热点,这个概念很模糊,有没有按照某种标准设计测试热点的分布?
    题目不会做详细说明,可以理解成,某些record的访问概率会比别人的多。
    2016-07-14 09:50:38
    赞同 展开评论 打赏
  • Re希望有更详尽的场景化说明
    顶一下,也是我们需要知道的问题。
    2016-07-13 15:08:49
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
《阿里巴巴Java开发手册(详尽版)1.4.0》 立即下载
自动化AutoTalk第三期-自动化实践Tips 立即下载
视频内容理解的研究与实践 立即下载

相关实验场景

更多