今天分享学习和面试经验的是学习群一位广东双非数学硕士,他研一开始零基础学习大数据开发,学习了几个月后,拿了几家大厂的offer并进行实习,这次秋招也收割了十几个大厂offer,基本都是SP,以下是部分offer,还有一些意向书直接拒了。
自我介绍:
本科:广东普通一本数学硕士,秋招拿了广东这边大部分大厂的大数据开发offer。
学习经历:
- 背景
- 在19年保送至本校硕士后,开始思考未来研究生毕业该从事什么样的工作,以及如何规划未来2.5年研究生涯。
- 因为从小对数字敏感以及从小接触互联网,觉得互联网的工作环境很高级,对大厂憧憬,感觉做这个工作很体面。因此希望从事数据挖掘、数据分析和数据开发的工作。
- 规划
- 由于我研究生期间为2019年-2022年,属于22届的应届生。那么我需要在2021年7月-2021年10月份参加秋招。因此我的准备时间为2019年7月-2021年7月,共有2年时间。由于2019年9月份-2020年6月份需要在校上课。因此19年9月-20年6月只能一边上课一边学习工作相关的知识。2020年7月-2021年7月可以在外实习,为秋招增加竞争力。
- 19年7月在网上搜索,网友说数据开发的门槛比较低,因此19年9月-20年3月在网上学习javaSE、数据结构与算法、hadoop、刷算法题。虽然疫情期间有大量的学习时间,但是学习过程发现学习艰难,没有指导,没有反馈,不知道自己学习效果如何。leetcode上浩如烟海的算法题让人怀疑人生。
- 开始
- 因此在20年4月份找峰哥帮忙规划学习路线、学基础、学项目、刷算法题。
- 从20年4月-20年6月,开始学习项目,刷剑指offer,背java、JVM、数据库等八股文理论。
- 两个月搞定了两个项目后,20年6月份开始应聘数据开发的工作,一开始面试很艰难,疫情慢慢结束,但是数据开发实习仍然很少。一开始只拿到广州的化妆品电商数据开发实习,去了3天。
- 公司的服务器持续被攻击,感觉这个氛围不行,无法接受。另外也拿到老百姓大药房数据开发实习,第四天提离职。
- 后来到7月份实习机会多起来,疫情管控变弱。又拿到吉比特数据开发实习。
- 实习了一段时间,又去面了腾讯,通过了,一直实习到春季实习,春季实习也拿了oppo、顺丰、Shopee,阿里lazada等offer。
- 这次秋招也在腾讯转正,并拿了字节百度等SP offer。
部分面试题参考:
- 介绍订单的开发过程
- 这个项目是你一个人在做,还是有老员工带着你做
- 除了后台开发,还有进行数仓方面的开发,是吗
- 主要负责哪一块的内容
- 只是从日志服务器取数据吗?
- 从日志服务器是直接用flume导入到HDFS吗?
- 为什么要分两层flume,不直接flume导入HDFS?
- 讲一下flume里面拦截器
- 为什么要分成两个topic传到kafka,后面不还是传到flume里消费吗?
- 有用到spark stream的一些操作吗?
- 数仓分几层?每层做什么?
- 数据可视化是自己开发吗?还是用工具?
- 有解析字段的函数,为什么要用UDF?怎么定位错误日志?
- 自定义UDF的步骤?
- 需求的指标是你倡议的?还是给的?
- 最近七天连续三天登录用户的指标代表什么含义?
- 除了简历上的指标,还分析过哪些指标?
- 有进行过优化吗?
- 为什么要压缩数据?对数据的压缩是在HDFS上进行吗?
- hive上有优化吗?sql语句上有优化吗?
- 有用代码实现mapjoin吗?
- 熟悉linux吗?awk怎么用?
- 全调度流程怎么实现?
- azkaban里面的job支持什么格式?
- 你觉得azkaban有什么优点?
- 有没有参与运维?
- 单例模式
- 工厂模式
- Tar
- Zip
- spark学到什么东西
- 人员配置
- 有多少台服务器(集群规模多大)
- 简述提交mapreduce流程的8个步骤
- hive分区和分桶技术,有什么用
- hive的架构
- 使用多线程要怎么使用
- 稍微介绍一下这个项目做了什么
- 项目用什么做的
- 人员配置
- 报表怎么开发
- 导师会带着做什么项目
- 导师有多少个学生
- 面试轮数=1
- 问题:
- 校园:
- 项目1:
- java的基础知识:
- Hadoop
- 数仓项目:
- linux:压缩的命令:
- 设计模式:
- 学习方法
- 为什么想来深圳工作
- 如何看待游戏行业
- 实习过程中最大的收获是什么
- 说说自己是怎样的一个人
- 自我介绍
- 主要做了什么工作
- 数据量有多大,人员组织架构
- 指标日活怎么定义,怎么计算
- 其他指标怎么计算
- 新增指标是n*n的join,你是怎么保证正常运行的
- 大数据量的复杂sql计算如何保证不崩溃,正常高效运行
- 实习生可以做这些的吗?
- 介绍一下项目
- 用一个指标举例子,介绍一下整个数据流的过程,是如何计算的
- 在计算指标的过程中遇到什么难题
- 数据量有多大,所有表有多大
- 可以看数据库的数据吗
- 用到了什么数据仓库模型
- 为什么要用星型模型,不用雪花模型?之前为什么要用雪花模型?
- 报表怎么开发,是什么样的
- 面试轮数=3
- 问题
- 一面(同事)
- 二面(组长)
- 三面(HR)
总结:
- 提前规划很重要
- 提前规划秋招需要构造的壁垒和门槛,例如熟练的理论和工具使用;丰富的大厂实习经验,含金量的项目经验等等。
- 等到秋招时,其他学生已经反应不过来了,想抄袭都来不及了。这样胜券在握
- 目标拆解
- 对总目标进行拆解成小目标
- 小目标更容易实现,有成就感
- 放平心态
- 结合1和2,规划何时达成各个目标
- 一步一脚印,脚踏实地
- 效果评估
- 通过面试评估自己的水平,让自己有反馈,刺激自己做的更好
--end--