读博还是找工作?数据科学家之路该怎么走?-阿里云开发者社区

开发者社区> 开发与运维> 正文
登录阅读全文

读博还是找工作?数据科学家之路该怎么走?

简介: 很多人对于数据科学领域充满热情,但同时也有着很多困惑不知该如何下手。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

image

很多人对于数据科学领域充满热情,但同时也有着很多困惑不知该如何下手。Python还是R语言?多学还是少学数学?要不要攻读博士?如何获得该领域的第一份工作?

这样的问题,笔者看到过很多。笔者不是职业咨询方面的专家,但基于对该领域的观察和多年来积累的经验,希望能给年轻人们一些建议。

1.学习机器学习的好资源有哪些?

笔者很喜欢安德鲁的“机器学习Coursera”课程。该课程入门时很容易,之后难度递增。它主要教授机器学习的基础知识,这是它的优点。

笔者建议各位至少去听一下前几节课。不能完全听懂也没有关系,以后随时可以重新观看课程。当然啦,不要只关注一门课程,大家的学习情况各不相同,根据自身情况来选择。

image

2.对于几乎没有任何技术背景的人来说,什么是最好的学习方法?

不要一个人学习!

寻找并加入网络社区将有助于各位的学习和成长。可以用Excel练习机器学习,试试线性回归吧。用它作为首次挑战,将会激发学习者的学习动力。

3.学习和实践数据科学的最佳方法是什么?

笔者建议从实际项目入手,然后在理论上慢慢发展。使用Kaggle笔记本是学习实践部分的好方法。在Reddit communities或Cross Validatedcommunity上面提问。

对所掌握的工具和实践知识感到满意以后,笔者建议自己构造一些问题的数据集(比如,可以自己抓取数据)并将机器学习算法应用于该数据集。

机器学习领域最难的是数据集构造,你甚至可以通过数据集构造建立公司。

4.该学Python还是R语言?

这是一个显而易见而又被忽略的问题吧。如果你还没有开始学习,那么笔者建议学习Python。主要原因如下:

  • 该语言仍在不断发展。
  • 丰富的数据科学生态系统、后端——凡是各位能说出来的,Python都有。

使用者可以利用Python进行分析,从头开始开发模型并在生产中运行。虽然可以肯定R语言的模型也可以在生产中运行,但笔者还尚未听说过。

如果各位了解R语言,也完全没问题。数据科学团队通常两种语言都用,根据喜好选择就OK。这并不重要,因为有些模型必须用编译语言(Java、Go)重新实现,从而在生产中进行更快的预测。

5.应该多上一些数学课吗?

长远来看,数学学得越多就越好。了解数学将有助于各位更好地明白刚刚编写的黑盒背后发生了什么。除此之外,将知识从理论转化为实践也更加容易。

image

6.数学和统计在数据科学工作中重要吗?

数学在改进模型方面发挥着至关重要的作用。数据科学工作者需要借助数学来弄清楚不同类型的模型、分布等事物之间的区别。一些高级机器学习工程师可以从优化函数中看出模型的主要属性。

7.应该学习结构化查询语言吗?

这个问题往往无法解决,但笔者的答案是“YES”!

无论是否要用结构化查询语言数据库,各位都应该从相关的数据库中了解主要概念,比如连接、分组依据、窗口函数、滞后、超前等等。即使是使用pandas、R语言或其他工具,这些概念也是必不可少的。

8.为了做好投身数据科学工作的准备,应该参加哪些课程?

任何领域都需要数据科学家,无论是现在还是将来。学习结束后,各位想去哪家公司实习?如果已经听过一些相关课程,那么你获得生物信息学领域的实习机会将更加容易。

9.如何获得数据科学领域的第一份工作?

参加本地的招聘会。公司在招聘会上猎寻新员工。还可以去数据质量评估部——规模较大的公司有这样的部门。也可以试试在网络上找工作。

10.从事数据科学工作需要博士学位吗?

不需要博士学位。从事数据科学工作意味着将机器学习模型应用于现实世界数据的分析。如果你的目标是研究和开发新的机器学习算法,那么笔者建议去攻读博士学位。

image

11.如何判断哪份工作提供最好的导师?

“如果你获得了多个工作机会,那么要选择导师更好的那个工作。”那么该如何判断哪份工作有最好的导师呢?

尽可能多地获取有关面试过程中的团队成员、经理、这些人背景等方面的信息。查看他们的领英页面,他们是否在Quora、StackOverflow、Medium上发表过自己的见解?发挥你的信息检索能力,做好调查很重要。

知道正确的道路要比埋头赶路重要很多,各位在怀着满腔热情投入数据科学行业之前,请先好好看清眼前的道路,以到达期望的远方。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-05-12
本文作者:读芯术
本文来自:“读芯术公众号”,了解相关信息可以关注“读芯术

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章