目前,人工智能行业非常火热,对应的数据科学分析岗位需求也非常大。很多程序员纷纷转行从事人工智能相关岗位,那么对于那些想从事数据科学岗位的人们来说,这里有五件重要的事情是在转岗之前需要了解的。
1.高等数学是数据科学的基础
矩阵计算、导数、特征值、集合、函数、向量、线性变换等数学知识对统计方法和编程背后的理论而言十分重要。因此,在开始你的MOOC课程或机器学习教材之前,你应该先自己检查一下对这些数学知识的掌握程度。大多数学校要求学生毕业时候能够精通这些知识,如果你之前没有完全掌握这些知识的话,也不要担心,毕竟学习这些知识也不需要花费太多的时间。
目前,网络上面有很多资源可供学习。但是,对我而言,最有效的是资源是线性代数漫画指南,该指南非常简单,生动形象,由浅入深的讲解相关线性代数知识。
我的建议是花费几个星期的时间将数学上的概念自查并弄明白,可以采用费曼技巧来解释每个概念。
注:费曼技巧很简单,首先拿张白纸,然后在白纸顶部写上你想理解的某想法或某过程,之后用自己的话解释它,就像你在教给别人这个想法。
2.最好的学习工具还是书籍
在试图进入某个新的领域时,类似于数据科学等领域,人们都会面临一个问题——信息过载。意思就是说有太多的资源可供获取,但是不知道如何下手。比如各种公开课、专业讲座视频等,这些资源大多食之无味、弃之可惜。我认为最好的方法是选择一本好的教材,花时间将其啃透。从最基本的概念开始入手,逐渐全方位填充自己。
根据本人的亲身经历,以下这种方法(以拼接玩具为例)对那些想从事数据科学的人来说是非常有用的,而且我也相信以下种学习方法对学习大多数新知识都是有一定作用的。
首先,你需要选择想要构建的玩具模型;
其次,打开所有装有零部件的塑料袋,并将装的玩具部件全部放在一个平面上,这样你就可以看到所有不同的部分;
之后,了解每个零部件如何使用,关注每个零部件的特征:尺寸、颜色、重量及形状等;
然后,等你掌握所有零部件的用途后,开始逐渐尝试构建玩具模型;
最后,在遵循说明书并建立想要的模型后,把所有部分拆开并重新开始新的实验;
数据科学的各个领域都应该采用同样的技术——了解所有的部分是什么、然后学习如何使用它们,之后当你想创造更复杂的东西时,去寻找那些你没有的部分。
3.计算机技能是必不可少的
计算机技能是不可或缺的,这不仅是在数据科学领域,而且未来的科技也需要具备这方面的能力。
当我作为一名数据科学专业的硕士时,我才意识到有些东西一直在隐蔽地通过博客文章、书籍和新闻传递下面信息:
“计算机程序占据了我们日常生活中的80%”
程序无处不在,我们日常生活中接触到的智能手机、网站、汽车、电视、医疗系统、公共交通、商品制造等领域中都存在程序控制。
几乎所有行业中的每一个工作/职业都会受到程序的直接影响,程序可用来实现信息的输入、转换和打印过程。学习编程以及编译原理不仅仅是制作软件、应用程序或创建网站所需要掌握的,它将使你有机会了解科技是如何影响我们的生活。不要把计算机程序归咎于人们“不情愿工作”,而是要系统地思考问题所在。
4.批判性和分析能力非常重要
我非常喜欢有关犯罪和破案的电视节目,其中一个电视节目是《天蝎》,主要讲述的是一帮天才利用技术和数学技巧解决各种问题的故事。除了所有的动作打斗、搞笑等场景外,这类节目的最精彩部分正是主角们使用“批判性思维”为不同的问题找到解决的方法,这是大多数数据科学资源中没有提到的一件事。找到正确的角度来处理问题的能力将使你不仅能够判断使用哪些工具用来解决对应的问题,而且有时候会引导你找到最有效的解决方案。
5.选择合适的工具
有许多可视化软件包(seaborn、gbplot、matplotlib)和软件(tableau、excel)可以帮助创造绝妙的图表。数据分析的重点不在于挑选多么复杂的软件包,最重要的如何传递这些数据信息。因此需要在工作中避免过多的选项,有时候最简单的工具会产生清晰明了的结果。
作者信息
Pedro Lopez,数据科学家,专注于金融、智能商业。
文章原标题《5 Things to Know Before Rushing to Start in Data Science》,作者:Pedro Lopez,译者:海棠,审阅:袁虎。
文章为简译,更为详细的内容,请查看原文