开发者社区> 问答> 正文

HBase单个scan和并行scan的效率

背景:假设有一个表,一个region,10个hfile,有bf,20条数据。
现在发起一个 get请求
数据在20条数据中
一问 hfile open了几次?
二问 有几次rpc调用?

数据不在这20条数据中
一问 hfile open了几次?
二问 有几次rpc调用?

展开
收起
hbase小能手 2018-11-06 13:40:03 4058 0
1 条回答
写回答
取消 提交回答
  • HBase是一个分布式的、面向列的开源数据库,一个结构化数据的分布式存储系统。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。阿里云HBase技术团队共同探讨HBase及其生态的问题。

    强答一下,理论上cpu和内存有富裕的情况下,并发的加载数据到blockcache然后再scan肯定要比单线程的操作快,但是数据量太小和太大都会出现相反的结果。如果数据量不是很大的话,建议请自测试。

    2019-07-17 23:12:25
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据时代的存储 ——HBase的实践与探索 立即下载
Hbase在滴滴出行的应用场景和最佳实践 立即下载
阿里云HBase主备双活 立即下载