大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

简介: 大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

停🤚

不要往下滑了,

默默想5min,

看看这5道面试题你都会吗?

面试题 01、列族设计规则是什么?
面试题02、Hive on Hbase的实现原理是什么?
面试题 03、Phoenix是什么?
面试题04、什么是二级索引?为什么要构建二级索引
面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

以下答案仅供参考:

面试题 01、列族设计规则是什么?

•个数原则:如果列的个数比较多,建议2 ~ 3个,如果列的个数比较少,建议1个

–列族个数多了,导致比较次数变多,降低性能

–列族个数少了,导致列的比较次数变多,降低性能

•长度原则 :能满足业务需求的情况下,越短越好

面试题02、Hive on Hbase的实现原理是什么?

•Hive on Hbase的原理是通过MapReduce实现对Hbase数据的读写

•MapReduce中提供了TableInputFormat读取Hbase数据,TableOutputFormat写入数据到Hbase

面试题 03、Phoenix是什么?

•Phoenix是一个专门为Hbase设计的SQL on Hbase的工具

•底层通过Hbase API和大量的协处理器实现

•可以实现基于SQL访问Hbase以及构建维护二级索引等功能

面试题04、什么是二级索引?为什么要构建二级索引

•二级索引指的是基于一级索引之上再构建一层索引

•Hbase使用Rowkey作为唯一索引,只有使用Rowkey前缀进行查询,才走索引查询

•导致大部分的查询都是不走索引,性能比较差

•通过建立二级索引,可以通过走两次索引代替全表扫描,加快查询速度

面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

•全局索引

•覆盖索引

•本地索引

•函数索引

总结

今天我们复习了面试中常考的Hbase相关的五个问题,你做到心中有数了么?

其实做这个专栏我也有私心,就是希望借助每天写一篇面试题,督促自己学习,以免在吹水群甚至都没有谈资!

对了,如果你的朋友也在准备面试,请将这个系列扔给他,

好了,今天就到这里,学废了的同学,记得在评论区留言:打卡。给同学们以激励。


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3天前
|
SQL 前端开发 程序员
【面试题】前端开发中如何高效渲染大数据量?
【面试题】前端开发中如何高效渲染大数据量?
|
3天前
|
设计模式 SQL 算法
大数据面试总结
大数据面试总结
46 0
|
3天前
|
存储 安全 Java
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
41 0
|
2天前
|
安全 前端开发 Java
Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day15
Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day15
|
3天前
|
分布式计算 监控 大数据
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
27 1
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
|
3天前
|
缓存 运维 NoSQL
面试分享:Redis在大数据环境下的缓存策略与实践
【4月更文挑战第10天】探索Redis在大数据缓存的关键作用,本文分享面试经验及必备知识点。聚焦Redis数据结构(String、List、Set、Hash、Sorted Set)及其适用场景,缓存策略(LRU、LFU、TTL)与过期机制,集群和数据分片,以及性能优化和运维技巧。通过代码示例深入理解,助你面试成功,构建高效缓存服务。
53 4
|
3天前
|
消息中间件 分布式计算 Kafka
50道大数据精选面试题
50道大数据精选面试题
|
3天前
|
Java 大数据
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day04】——JavaSE
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day04】——JavaSE
39 0
|
1天前
|
移动开发 前端开发 JavaScript
Java和web前端,IT新人该如何选择?,2024年最新Web前端内存优化面试
Java和web前端,IT新人该如何选择?,2024年最新Web前端内存优化面试
|
1天前
|
安全 Java 数据库
Spring boot 入门教程-Oauth2,java面试基础题核心
Spring boot 入门教程-Oauth2,java面试基础题核心

热门文章

最新文章