我,27岁,放弃数学系博士学位,零基础转型大数据开发

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 我,27岁,放弃数学系博士学位,零基础转型大数据开发

今天分享的是学习群的一位小伙伴,他本科985,然后继续在华东某高校硕博连读,数学专业。但由于各种原因,他放弃了近在咫尺的博士学位,转型大数据开发进入工业界。

 

自我介绍
我本科就读于一个985高校,2017年从本科学校毕业,然后保研硕博连读就读于现在的华东某学校,读的专业是基础数学。


image.png


由于我读博不顺利,一方面天赋不够,另一方面老师对我影响很大,具体不细说了。再加上现在进高校真的非常非常不容易,所以我萌生了转行的想法。如果我转到计算机行业,肯定拿不到博士学位了,不过可以拿个硕士学位。

在大学院校待的时间太久,学校的信息又非常闭塞,大家又都是“书呆子”,我的认知与当下的社会是非常脱节的。

另外就是家境比较贫寒,加上我在学术读的非常不顺,我的心理压力越来越大,最终经过一番长时间的思想斗争和挣扎之后,我选择了放弃读博,并在朋友的介绍下认识了峰哥,然后走上了自学大数据开发的道路。



学习过程

由于计算机分工很多,五花八门,我不知道自己该学什么?从什么角度入手?有人建议我从开发开始做,他说那是基础,我也不懂,所以想多问问几个人?尤其是具体的学习路径,书籍,视频,平台,学习的周期,面试笔试的技巧,怎样找找实习等等诸如此类。网上学习资料太多,多问一下专业人士,可以少走很多弯路。

我是按照峰哥给我规划的学习路线去学习大数据的,但是说实话我学的不算好,一个很重要的原因是我找峰哥太晚了,我是6月份找峰哥的,然后7月初开始学大数据的课程,一共就学了Java ,hadoop,spark的入门课程,后面还学了项目,以及边补基础。

一个很重要的原因是时间太紧了,我准备得太晚了,主要我既要学习课程,同时还要忙论文发表的事情,还要自己找招聘信息,还要被很多杂事给耽误掉。


另外,我的心态不是很好,也确实影响到了我的学习进度,这里很感谢峰哥,能以他的角度和经验帮我梳理了进度,让我能更加从容地进行学习。

总之,时间并不是很宽裕,等到招聘旺季金九银十的时候,我就感觉自己忙不过来了。这里我想说一下的是招聘信息一定要自己去找,不要只看学校里发的信息,这样才能发现更多机会。

我自己求职信息的渠道有应届生求职、中华英才网、拉钩直聘、脉脉、领英、boss直聘、赶集网、全国顶尖高校各自的就业信息网,搜集信息是个极其费时费力的事情,它会消耗大量精力。

所以正如峰哥所言,如果要转行,一定要早做准备,一个巨大的好处是在招聘旺季就可以全心全意地去找工作,不会搞得身心俱疲。


面试经历

分享一下自己的面试经历,希望能够帮助到大家。

第一、我想谈谈我自己投简历的策略,前期要海投,尤其是你自个觉得差不多能进的公司要多投,这样你才能拿到offer保底。

后期大公司、好公司要敢投,比如拿我自己来说,我当时投了一家日本的跨国公司,也是IT行业,要去日本东京的那种,虽然最后我被刷了,终究底子太差,不过其实它愿意让我面试,我已经万分欣喜了,这就是机会,遗憾的是我并没有抓住。


第二、由于我是数学系的,我想告诉大家,这真的给我带来了很大的优势,非常惭愧地说,我之所以能拿到offer,有一部分原因是因为我身上的名校光环以及我的专业,否则我很难拿到这么多高薪的offer,我面试了这么多轮下来的体验是应用数学+计算机在目前市场上是香饽饽,备受欢迎。

拿我的室友来说,他是应用数学系出身,对C++又非常熟悉,有十年的编程经验,最终进了大家耳熟能详的大厂,年薪50W+。


第三、项目真的很重要,项目真的很重要,项目很重要,我面的几乎所有公司都会问我项目经历,如果能够再加上实习经历,当你去面试时,优势将会很大,峰哥之前也强调过。

另外,有参加过建模比赛还有机器学习的比赛也会是一个很好的加分项,不过一定要提前准备,面试官看过简历后,基本上都会问建模或机器学习的比赛中的细节。


第四、我一共面了六种类型的企业,互联网公司、新能源汽车公司、银行信息科技部、芯片公司、工业机器人公司、医疗科技公司。投递的岗位主要就是两种大数据开发、算法。前三类公司侧重于Java开发和大数据开发,后三类公司侧重于机器学习和算法,语言是C++和python。


总结

虽然准备的时间不是很长,但我对于我能拿到的offer已经非常满意。我原本给自己订的短期目标是年薪20W的工作。


image.png


但经过这几个月了解下来,20W在计算机行业真的不高,这也是因为我信息闭塞,对互联网行业了解太少,最终拿的offer薪资都基本翻倍。


我是非常非常喜欢数学,但经济条件不允许我把工作纯当爱好。选择大数据开发的原因,一方面薪资待遇好,另外一方面比较贴近机器学习,后面也可以结合数学进行发展。


喜欢科研也是一件幸福的事情,但科研不是你自己的事情,还需要综合导师、实验室环境等等,所以能好好科研也是一种运气。


最后,大家一定要趁早准备,早做准备会有更多机会和选择,学习起来也会更从容一些。

--end--

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何开发ODPS Spark任务
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
SQL 分布式计算 大数据
代码编码原则和规范大数据开发
此文档详细规定了SQL代码的编写规范,包括代码的清晰度,执行效率,以及注释的必要性。它强调所有SQL关键字需统一使用大写或小写,并禁止使用select *操作。此外,还规定了代码头部的信息模板,字段排列方式,INSERT, SELECT子句的格式,运算符的使用,CASE语句编写规则,查询嵌套规范,表别名定义,以及SQL注释的添加方法。这些规则有助于提升代码的可读性和可维护性。
68 0
|
3月前
|
SQL 分布式计算 大数据
大数据开发SQL代码编码原则和规范
这段SQL编码原则强调代码的功能完整性、清晰度、执行效率及可读性,通过统一关键词大小写、缩进量以及禁止使用模糊操作如select *等手段提升代码质量。此外,SQL编码规范还详细规定了代码头部信息、字段与子句排列、运算符前后间隔、CASE语句编写、查询嵌套、表别名定义以及SQL注释的具体要求,确保代码的一致性和维护性。
113 0
|
5月前
|
SQL 分布式计算 MaxCompute
SQL开发问题之对于ODPS中的UNION操作,执行计划的问题如何解决
SQL开发问题之对于ODPS中的UNION操作,执行计划的问题如何解决
|
5月前
|
存储 分布式计算 MaxCompute
构建NLP 开发问题之如何支持其他存储介质(如 HDFS、ODPS Volumn)在 transformers 框架中
构建NLP 开发问题之如何支持其他存储介质(如 HDFS、ODPS Volumn)在 transformers 框架中
|
4月前
|
数据可视化
Echarts数据可视化开发| 智慧数据平台
Echarts数据可视化开发| 智慧数据平台
|
4月前
|
数据可视化
Echarts数据可视化大屏开发| 大数据分析平台
Echarts数据可视化大屏开发| 大数据分析平台
|
4月前
|
分布式计算 大数据 Java
Scala 入门指南:从零开始的大数据开发
Scala 入门指南:从零开始的大数据开发
|
5月前
|
分布式计算 自然语言处理 MaxCompute
构建NLP 开发问题之如何在数据加载框架中实现从两个ODPS表中分别读取正样本和负样本,并在batch内以1:1的方式混合
构建NLP 开发问题之如何在数据加载框架中实现从两个ODPS表中分别读取正样本和负样本,并在batch内以1:1的方式混合
|
5月前
|
SQL Java 大数据
开发与运维应用问题之大数据SQL数据膨胀如何解决
开发与运维应用问题之大数据SQL数据膨胀如何解决