一、机器学习简介

简介: 一、机器学习简介

1、机器学习的应用案例



1、数据挖掘: 自动化和网络提供了大量的源数据,如网页点击数据;电子医疗数据;生物数据;工程数据等;


2、应用于不能手动编写的代码开发: 如无人直升机;手写字迹识别;大多数自然语言处理(NLP),和计算机视觉等


3、私人订制程序: 如Amazon,Netflix,iTunes Genius的产品推荐等。



2、机器学习的定义



Arthur Samuel(1959)将机器学习定义为:为赋予计算机学习能力而无需明确学习的研究领域。这是一个比较老旧的同时非正式的定义。


Tom Mitchell(1998)从案例的角度定义机器学习:一个计算机程序从经验E学习一些任务T和一些性能指标P,如果他在T上的性能(由概率P测量),随着经验E的提高而提高。对于跳棋游戏,上述的E,T,P则分别对应:E对应着玩跳棋游戏的经验;T对应着玩跳棋游戏的任务;P对应着程序赢得下一次游戏的概率。下面通过一个例子来进一步理解任务,经验和性能指标。


4039f8bb6f0e486f89122f086c66890d.png


在上述小例子中,任务对应的是A,经验对应的是B,而性能指标对应的是C。


机器学习又可以分为监督学习和非监督学习两种。




3、监督学习



在监督学习中,首选会给定一套数据集和这套数据集对应的已知的输出结果,同时认为这套输入的数据集和结果之间存在关系。


监督学习的一大分类为“回归(regression)”问题,这类问题中,我们试图预测连续的结果值,更通俗地说,我们试图通过输入的变量获得一个连续函数。下面是一个“回归”问题的例子,房价预测问题,加入当前已经有一系列房子大小的数据和不同大小房子对应的价格数据,我们想要获得一个房价关于房子大小的连续函数,这就是一个回归问题。


8d1381b274944f42b872e523c1045f8d.png


监督学习的另外一大分类为“分类(classification)”问题,在这类问题中,我们试图以离散的形式来预测结果,换句话说,就是把输入变量映射到离散的输出分类中。如下图根据肿瘤的大小来预测这个肿瘤是良性的还是恶性的。

149650ba224842f9b929711cc1dd0ad4.png

或者通过更加复杂的分类标准,通过年龄和肿瘤大小两个因素作为输入参数,来进行判定肿瘤的良性还是恶性。

a72f8c14e36640e4be113f2f5c2ace8a.png


更加复杂的问题包括输入的特征可以有无限多个,根据这些输入的特征来获取分类的结果。下面是一个小例子来判断问题属于回归问题还是聚类问题。

50159d6c00514686b433171c7981dbb7.png


4、无监督学习



无监督学习是我们可以处理结果数据较少或者没有结果参考的数据集。我们可以从不知道变量之间的相互作用的数据之中提取出有用的结构。我们可以基于数据变量之间的关系来聚类数据从而获得这个结构。在无监督学习中,预测出的结果不会有反馈机制。


聚类学习一个应用的案例:Google新闻每天都会从各大新闻网站搜集各种新闻的标题数据信息,之后将他们按照词义进行聚类,从而完成每天同一个大事件不同新闻的整合推送。另一个应用案例为:首先收集1000000个人的基因结构数据,之后根据他们基因数据的异同将他们划分到不同的类别之中,如不同的年龄,性别,工作等。image.png


另一个无监督学习算法的实际应用为音频分离和提取,如“鸡尾酒聚会问题”,通过“鸡尾酒算法”可以将混杂在一起的不同声音进行分别提取,使用的函数如下所示:

[W,s,v] = svd((repmat(sum(x.*x,1) size(x,1),1).*x)*x');


下面的小例子简单测试哪些问题属于非监督学习:


f717d0b6e5484fc097cdb924b494a1a3.png


上述小测验中,新闻自动归类和将客户进行市场细分两个例程属于非监督学习的范畴。



相关文章
|
8月前
|
机器学习/深度学习 算法 自动驾驶
使用机器学习进行图像分类的简介
在现代技术的发展中,图像处理和图像分类一直是一个热门的领域。随着机器学习的兴起,越来越多的人开始使用机器学习算法来解决图像分类问题。本文将介绍如何使用机器学习进行图像分类,并讨论其中的关键步骤和技术。
236 1
|
10月前
|
机器学习/深度学习
阿里云最新产品手册——阿里云核心产品——机器学习平台PAI——简介
阿里云最新产品手册——阿里云核心产品——机器学习平台PAI——简介自制脑图
166 1
|
3天前
|
机器学习/深度学习 监控 算法
|
15天前
|
机器学习/深度学习 资源调度 分布式计算
机器学习的线性模型简介
机器学习的线性模型简介
16 0
|
4月前
|
机器学习/深度学习 分布式计算 算法
Spark MLlib简介与机器学习流程
Spark MLlib简介与机器学习流程
|
5月前
|
机器学习/深度学习 搜索推荐 算法
「机器学习」推荐系统简介——一起来看看你是怎么被大数据杀熟的(四)
「机器学习」推荐系统简介——一起来看看你是怎么被大数据杀熟的(四)
36 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
机器学习简介及Hello World级别算法KNN
机器学习简介及Hello World级别算法KNN
|
5月前
|
机器学习/深度学习 数据采集 自然语言处理
【机器学习】Rasa NLU以及Rasa Core概念和语法简介(超详细必看)
【机器学习】Rasa NLU以及Rasa Core概念和语法简介(超详细必看)
201 0
|
8月前
|
机器学习/深度学习
机器学习线性回归简介
机器学习线性回归简介
42 0
|
11月前
|
机器学习/深度学习 数据采集 人工智能
学习笔记: 机器学习经典算法-简介
机器学习经典算法-个人笔记和学习心得分享
75 0

热门文章

最新文章