从面试官的角度谈谈大数据面试

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 作为一只老鸟,我的面试经验还算丰富,无论是作为面试者还是面试官。其实这篇对于面试者来说也是有意义的,毕竟知己知彼,百战不殆,知道对方会从哪些方面问问题,从哪些方面考核,才能更好地提前做好准备。首先,我觉得面试官有责任保证面试过程是一次高效的交流。你要获取到你需要的信息,对面试者做全方位的考量;面试者也要获取到他需要的信息,面试官(若面试成功很大可能是自己的上级)的水平,公司技术要求水平,自己是否适合这家公司,公司是否需要自己。面试是一个双向选择的过程,面试官在选人,面试者在选公司。而面试者了解这家公司最直接的途径就是通过面试官。

作为一只老鸟,我的面试经验还算丰富,无论是作为面试者还是面试官。其实这篇对于面试者来说也是有意义的,毕竟知己知彼,百战不殆,知道对方会从哪些方面问问题,从哪些方面考核,才能更好地提前做好准备。

首先,我觉得面试官有责任保证面试过程是一次高效的交流。你要获取到你需要的信息,对面试者做全方位的考量;面试者也要获取到他需要的信息,面试官(若面试成功很大可能是自己的上级)的水平,公司技术要求水平,自己是否适合这家公司,公司是否需要自己。面试是一个双向选择的过程,面试官在选人,面试者在选公司。而面试者了解这家公司最直接的途径就是通过面试官。

说说面试官
我先说几个面试官常会有的问题。

问题问得太跳跃,想到什么问什么
抓住一个面试官自己很熟的知识点或者方向往死里问 ,完全不会根据面试者的回答情况做调整(我是来面试的,不是来看你炫技的)
只问技术,不问业务
技术问题问得太表面
当然我也见过不错的面试官,问题问得很有水平。那有水平的面试官会给人什么样的感觉?

答得很舒服,不管结果怎么样,总之能展现出自己应有的水平
面试过程是有收获的,没有白来,知道了自己的欠缺
如果面试者是个到处抢着要的高手,那你有水平的提问会给这个面试者留下深刻印象,毕竟大家都是喜欢和厉害的人当同事的
说说提问
思路想法,表达能力,技术功底,热情。这几个点我是比较看重的。很多问题都是围绕着这几个点展开的,大家看下有没有借鉴意义

1.技术能力
这个是硬指标,不过关的基本是可以一票否决的,当然技术能力的标准是根据工作年限,面试职位和薪资要求共同来决定的。面试官要根据实际情况有自己的判断。

那技术能力如何考察?我提几个方面

基础能力
java 的 jvm、多线程、类加载等

scala 伴生对象,偏函数,柯里化等

还有shell和python的就不举例了

HBase读写流程

Yarn任务提交流程等等

底层原理
Hbase是如何存数据的,为什么读得快

spark为什么就算不在内存跑也比mr快

zookeeper数据怎么保证一致性

说说选举机制

等等

源码
有没有读过源码?

详细说下你从源码中获取到了什么信息,有什么帮助

架构设计能力
如何技术选型,考虑哪些因素?

设计一个同时满足实时和离线分析需求的平台

为什么这么设计?

另外
以上问题如果回答得不太好,可以再给个机会让他说下自己最熟悉的技术,不限制从哪些方面讲。

2.解决问题能力
如何排查hbase集群cpu过高问题

如何优化spark任务

......

3.方案设计能力
说说数据仓库设计建模过程

说说数据质量监控系统怎么设计

......

4.想法
这是一道开放题

对数据治理有什么想法

对职业生涯的规划

......

5.还可以再问些偏向管理的问题
如何调动组员的技术学习积极性等

6.唠嗑
上面的问题问完觉得感觉可以的话可以,可以唠唠嗑,问些其他问题。

为何离职?

觉得自己是什么样的性格等等

当然这些都不太重要了主要就是考察下你的语言表达能力和三观是不是正的。

提问的技巧
问问题要有技巧,循循善诱而不是想到什么问什么

举个简单的例子

问:zookeeper加大量节点会对文件写入速度有什么影响?为什么?
答:不清楚
问:你觉得zookeeper作为分布式协调系统对一致性有什么要求呢
答:强一致性
问:那你觉得要如何保证强一致性,或者说保证强一致会不会对其他方面的性能有影响
......
不知道大家有没有看出来,最后一个问题其实是第一个问题的答案,当面试者回答不出来的时候不用急着换其他方面的问题,毕竟很多东西没接触过确实就是不知道。

你可以适当地引导他回答的方向,这样很能看出他的思维能力,如果他能把这两个游戏买号平台问题立马关联起来回答,那我觉得还是可以加分的。

面试者如果听出了这两个问题的关联,恍然大悟,也会觉得面试官提问很有技巧,提升好感,对他来说选公司方面也是有加分的。

最后
上面的内容希望能对一些面试者或者面试官有帮助。当今时代,跳槽确实是大部分程序猿升职加薪最快的方式,特别是职业生涯初期。说起来也是很无奈,公司经常是宁愿花更多的钱来请个新人也不愿意加薪留住老人。

因此现在很多大公司的管理者都很喜欢强调文档落地,需求方案,技术方案,解决方案等等都要有记录,这样可以保证新人能快速上手,即插即用。

说白了就是保证这个项目组没了任何一个人,都可以继续正常运作。这个先不说了扯远了,有空再聊。

这个行业就是这样我们没有办法改变TA那就只能适TA。

觉得有帮助的话点个赞吧,如果点赞量多的话,我会再写一篇 [从面试者的角度谈谈大数据面试]。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
6月前
|
SQL 大数据
常见大数据面试SQL-每年总成绩都有所提升的学生
一张学生成绩表(student_scores),有year-学年,subject-课程,student-学生,score-分数这四个字段,请完成如下问题: 问题1:每年每门学科排名第一的学生 问题2:每年总成绩都有所提升的学生
|
6月前
|
存储 Java 编译器
【搞定Jvm面试】 面试官:谈谈 JVM 类文件结构的认识
【搞定Jvm面试】 面试官:谈谈 JVM 类文件结构的认识
|
6月前
|
缓存 Java 数据库
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
Java 测试技术 持续交付
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
Java 测试技术 开发者
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
XML JSON JavaScript
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
Java 数据库连接 数据库
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
Java 数据库连接 数据库
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
设计模式 前端开发 Java
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!
|
6月前
|
Java 数据库连接 数据库
Java面试50问,女面试官最喜欢问的居然是它!
Java面试50问,女面试官最喜欢问的居然是它!