机器学习(ML)是教导计算机系统根据一组数据进行预测的过程。通过为系统提供一系列的试验和错误场景,机器学习研究人员致力于创建 可以分析数据,回答问题并自行做出决定的人工智能系统。
机器学习通常使用基于测试数据的算法,该算法有助于在将来的决策中进行推理和模式识别,从而消除了对传统计算机软件要求的来自人类的明确指令的需求。
什么是机器学习?
机器学习依赖于大量数据,这些数据被馈送到算法中,以生成一个模型,系统可以根据该模型来预测其未来的决策。例如,如果您要输入到系统中的数据是一年中每天在午餐中吃的水果,则您可以使用预测算法来分析不同的水果,并为该水果建立预测模型您可能在第二年进食。
该过程基于反复试验的情况,通常使用多种算法。这些算法分为线性模型,非线性模型,甚至神经网络。它们最终将取决于您正在使用的数据集以及您要回答的问题。
机器学习算法如何工作?
机器学习算法会随着时间的推移使用数据来学习和改进,并且不需要人工指导。该算法分为三种类型:有监督,无监督和强化学习。每种学习类型都有不同的目的,并且可以使数据以不同的方式使用。
监督学习
监督学习涉及标记的训练数据,算法使用该训练数据来学习将输入变量转换为输出变量以求解方程的映射函数。其中有两种监督学习类型:分类,当输出为类别形式时,用于预测给定样本的结果;回归,当输出时,用于预测给定样本的结果。变量是实际值,例如“工资”或“权重”。
监督学习模型的一个示例是K-最近邻居(KNN)算法,它是一种模式识别方法。KNN本质上涉及使用图表来根据附近相似物体的传播情况得出关于物体分类的有根据的猜测。
在上表中,绿色圆圈表示一个尚未分类的对象,它只能属于两个可能的类别之一:蓝色正方形或红色三角形。为了识别其所属的类别,在这种情况下,算法将分析图表上最接近的对象,算法将合理地假设绿色圆圈应属于红色三角形类别。
无监督学习
当只有输入变量而没有相应的输出变量时,将使用无监督学习模型。它使用未标记的训练数据来建模数据的基础结构。
无监督学习算法有三种类型:关联,广泛用于市场购物分析;聚类,用于匹配与另一个聚类中的对象相似的样本;和降维,用于减少数据集中变量的数量,同时保持其重要信息不变。
强化学习
强化学习允许代理通过学习最大化奖励的行为,根据其当前状态决定其下一步行动。它通常用于游戏环境,在游戏环境中提供了规则的算法,并负责以最有效的方式解决挑战。该模型最初会随机开始,但是随着时间的流逝,通过反复试验,它将了解需要在游戏中移动的位置和时间以最大化得分。
在这种类型的培训中,奖励仅仅是与积极成果相关的状态。例如,如果算法能够将汽车保持在道路上而不会撞到障碍物,那么它将“奖励”任务完成。
为什么机器学习很有用?
本质上,机器学习解决了数据过多的问题。人们,行动,事件,计算机和小工具所产生的信息太多,以至于人类几乎不可能从中学习任何东西。在医学分析中,要在成千上万的MRI扫描中找到模式,一个人可能要花费数小时,数天或数周的时间才能完成,但是如果正确标记了机器,机器可以吸收这些信息并在几秒钟内发现这些模式。
机器学习在哪里使用?
我们每天都会使用最简单,最成功的机器学习示例之一-Google搜索。搜索引擎由许多ML算法提供支持,这些算法可以读取和分析您输入的文本,并根据您的搜索历史和在线习惯来定制结果。例如,如果您输入“ Java”,您将获得围绕编程语言的结果,或者更频繁地浮出水面,这取决于它决定了您的偏好。
我们未来的许多技术进步都取决于机器学习的发展,例如无人驾驶汽车和智慧城市。许多为智慧城市提供动力的系统正在进入公共空间,例如面部识别系统,该系统中的机器学习算法被教为识别图像中的模式并根据其特征识别对象。但是,这已被证明是ML的有争议用途,尤其是因为它并不总是准确的,并且经常涉及对公民的某种定期监视。
数据偏差
随着机器学习的改进和更多技术的使用,人们越来越担心将偏见嵌入关键的和面向公众的软件中。机器学习应用程序依赖于数据,而正是这些数据可能成为偏差的来源。例如,如果一家公司想雇用更多不同种类的人,但使用其当前雇员的简历,则默认情况下,其机器学习程序将只寻找更多相同的人。
正是这种类型的机器学习应用引起了政府的担忧,因此,许多政府正在采取强制性的法规来解决这个问题。英国数据伦理与创新中心(CDEI)宣布将与内阁办公室种族差异部门合作,调查算法决策中的潜在偏见。同样,美国政府将试行AI方面的多样性法规,以降低计算机系统中性偏见和种族偏见的风险。
原文链接:https://ai.51cto.com/art/202011/631462.htm
本文转自51CTO,本文一切观点和机器智能技术圈子无关。
在线免费体验百种AI能力:【点此跳转】