大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day09】——Hbase3

简介: 大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day09】——Hbase3

停🤚

不要往下滑了,

默默想5min,

看看这5道面试题你都会吗?

面试题 01、表的Region的划分规则及数据写入分区的规则是什么?
面试题02、Region的内部存储结构是什么?
面试题 03、什么是热点问题?
面试题04、怎么解决热点问题?
面试题05、Rowkey如何设计,设计规则是什么?

以下答案仅供参考:

面试题 01、表的Region的划分规则及数据写入分区的规则是什么?

•Region划分规则:范围划分,一张表可以在Rowkey行的方向上划分多个Region,每个Region构成一段连续的区间

•数据划分规则:根据Rowkey属于哪个Region的范围,就将这条数据写入哪个Region分区中

面试题02、Region的内部存储结构是什么?

•每个RegionServer中管理多个Region

•每个Region中根据列族划分多个Store

•每个Store中有1个memstore和多个StoreFile文件

•数据写入memstore中,如果达到内存阈值,memstore中的数据将写入StoreFile

面试题 03、什么是热点问题?

•现象:在某个时间段内,大量的读写请求全部集中在某个Region中,导致这台RegionServer的负载比较高,其他的Region和RegionServer比较空闲

•问题:这台RegionServer故障的概率就会增加,整体性能降低,效率比较差

•原因:本质上的原因,数据分配不均衡

•情况

–一张表只有一个Region

–一张表有多个Region,但是Rowkey是连续产生的

面试题04、怎么解决热点问题?

•合理的设计Rowkey,构建不连续的Rowkey

•根据Rowkey的前缀,为表划分多个Region

面试题05、Rowkey如何设计,设计规则是什么?

•业务原则:贴合业务,保证前缀是最常用的查询字段

•唯一原则:每条rowkey唯一表示一条数据

•组合原则:常用的查询条件组合作为Rowkey

•散列原则:rowkey构建不能连续

•长度原则:满足业务需求越短越好

总结

今天我们复习了面试中常考的Hbase相关的五个问题,你做到心中有数了么?

其实做这个专栏我也有私心,就是希望借助每天写一篇面试题,督促自己学习,以免在吹水群甚至都没有谈资!

对了,如果你的朋友也在准备面试,请将这个系列扔给他,

好了,今天就到这里,学废了的同学,记得在评论区留言:打卡。给同学们以激励。


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3天前
|
SQL 前端开发 程序员
【面试题】前端开发中如何高效渲染大数据量?
【面试题】前端开发中如何高效渲染大数据量?
|
3天前
|
设计模式 SQL 算法
大数据面试总结
大数据面试总结
46 0
|
3天前
|
存储 安全 Java
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
41 0
|
2天前
|
安全 前端开发 Java
Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day15
Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day15
|
3天前
|
分布式计算 监控 大数据
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
27 1
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
|
3天前
|
缓存 运维 NoSQL
面试分享:Redis在大数据环境下的缓存策略与实践
【4月更文挑战第10天】探索Redis在大数据缓存的关键作用,本文分享面试经验及必备知识点。聚焦Redis数据结构(String、List、Set、Hash、Sorted Set)及其适用场景,缓存策略(LRU、LFU、TTL)与过期机制,集群和数据分片,以及性能优化和运维技巧。通过代码示例深入理解,助你面试成功,构建高效缓存服务。
53 4
|
3天前
|
消息中间件 分布式计算 Kafka
50道大数据精选面试题
50道大数据精选面试题
|
3天前
|
Java 大数据
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day04】——JavaSE
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day04】——JavaSE
39 0
|
1天前
|
移动开发 前端开发 JavaScript
Java和web前端,IT新人该如何选择?,2024年最新Web前端内存优化面试
Java和web前端,IT新人该如何选择?,2024年最新Web前端内存优化面试
|
1天前
|
安全 Java 数据库
Spring boot 入门教程-Oauth2,java面试基础题核心
Spring boot 入门教程-Oauth2,java面试基础题核心

热门文章

最新文章