2018 年,人工智能在各行各业中的落地应用越来越多。十多年前,所有的企业都在想办法互联网化,如今,所有的互联网企业都在试图 AI 化。技术的竞争归根结底表现为人才的竞争,毫无疑问 AI 工程师是 IT 行业需求缺口最大的高端技术岗位,薪资水平虽远高于其他行业,但 AI 工程师依然供不应求。除了高校里科班出身的相关专业毕业生,有代码经验的转型程序员也广受 AI 公司的欢迎。
据招聘网站的数据统计显示,最高薪酬的 56 个岗位 ( 分为:60-100 万、100 万 + ;两档 ) ,要求硕士以上学历的岗位有 30个,比例 53%,比 AI 工程师中硕士学历要求的平均比例 28.6%,高出一倍。
在这高薪光环下,涌入AI行业的朋友越来越多。但是你们对AI了解多少呢?还是只知道一些高大上的名词,高大上的话语都是写给初学者或者其他领域的朋友来看的。就拿机器学习来说,真正的去学习机器学习的朋友们会深有体会,机器学习就是让机器会“学习”,所谓的学习就是建立了一些模型、掌握了一些数据、去做了训练和预测,然后对我们接下来要做的事情有一定的自己处理的能力,甚至说人工智能其实就是基于大数据和概率论等方法建立的处理问题的模型。在我们这学习机器学习之前,我们会经常接触一些词汇如:数据集、训练集、模型、监督学习、非监督学习等等。
那么通俗点讲,何为机器学习?也就是说机器学习不需要制定具体的模型,而是让计算机根据庞大的数据量自己训练模型,与之相对的,例如CFD软件,是建立在物理模型之上的,例如输运方程等。在学习机器学习之前我们先了解一下何为监督学习和非监督学习,半监督学习暂时不介绍。
一、监督学习(Supervised learning)
数据集中的每个样本有相应的“正确答案”,根据这些样本做出预测,分有两类:回归问题和分类问题。
(1)回归问题
例如预测房价,根据样本集拟合出一条连续曲线
(2)分类问题
例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的
二、非监督学习(Unsupervised learning)
非监督学习的数据集跟监督学习不同,没有任何标签,即没有相应的“正确答案”。从数据集中可以通过非监督学习得到数据的某种结构,可能是把数据分成两个不同的聚集簇,称为聚类算法。
以上我们看到这些是处理后的结果,要想成为合格的机器学习工程师,我们要熟练如何把收集来的数据集进行处理,如何建立算法模型、评估模型好坏,如何去做实际问题的预测和分析等等都是我们需要学习的内容,可谓是任重而道远!
机器学习最有说服力的是它似乎无限的适用性。机器学习已经让很多领域受到了影响,包括教育,金融,计算机科学等。几乎没有机器学习不适用的领域。在某些情况下,实际上很迫切需要机器学习技术。医疗保健是一个明显的例子。机器学习技术已经应用于医疗保健领域的关键领域,已经影响了从护理学到医学扫描分析的一切。
世界毫无疑问地以快速和戏剧性的方式发生变化,机器学习工程师的需求将呈指数级增长。 这个世界的挑战很复杂,需要复杂的系统来解决它们。 而机器学习工程师正在构建这些系统。 如果这是你的未来,那么请抓紧一切时间开始掌握这些技能吧。