开发者学堂课程【机器学习算法 :机器学习的基本概念-2】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/535/detail/7167
机器学习的基本概念-2
内容介绍
一、假设空间的概念
二、假设空间的历史
三、假设空间的讲解
一、假设空间的概念
假设空间( Hypothesis Space):由输入空间到输出空间的映射的集合 ,称作假设空间。
二、假设空间的历史
监督学习的目的在于学习一个由输入到输出的映射,这一映射由模型来表示。换句话说,学习的目的就在于找到最好的这样的横型。模型展于由输入空间到输出空间的映射集合,这个集合就是假设空间。假设空间的确定意味着学习范围的确定。
-李航《统计学习方法〉
The hypothesis space, which defines the class of functions mapping the input space to th
e output space. That is, the functions operate on the feature vectors of the input object
s, and make predictions according to the format of the output space.
-李铁岩 Learning to Rank tor Information Retrieval
假设空间指的是问题所有假设组成的空间,我们可以把学习过程看作是在假设空间中搜索的过程,搜索目标是寻找与训练集”匹配”的假设。
一周志华《机器学习》
《机器学习》不适合基础操作,适合有一定进阶,系统化已有流程知识。
《统计学习方法》从统计的方面学习
三、假设空间的讲解
例如:
某商品的浏览、购买记录中,记录了性别、信用度及是否购买,基于数据建模。其中 性别 Gender 取值为 { Female,Male },Credit 取值为 { High, Mediun, Low ],Buy 的取值为{ TRUE, FALSE)
Gender 、Credit 是输入空间,不做映射就是特征空间。Buy 是输出空间。
在输入空间和输出空间之间建立映射关系,即假设空间。
输入记录中所有可能出现的值的组合为(不重复) 2x3=6个,列表如下:
上述每个组和最终都可能有(最多)两个,即 true 或 false:
上表是否为假设空间?
针对每一种的输入,都能找到一个映射,对应了输出空间中某个输出。
以上是12条记录:
female 和 high 可能有两种输出:true 或者 false;假设每一个都选择一个输出。6个输出空间对应了一个输出结果。
这个东西我们称为一个假设。假设为 h,i 为下标。
所有的输入空间对应一个结果,叫做假设。这是一种映射方式。
针对每一种可能的输入,都能找到一个映射,对应了输出空间中某个输出。
算一下总共可能出现的假设 hi 个数:
都一条:female 和 high 只有两种可能 true 或 false;两种取法
下面的5者都是有两种取法。
总共可能出现的假设个数 hi 个球数:就是将取法乘起来。
通常我们会加上一个特殊的假设,全空,即2的6次方加1
更一般的,假设空间H中的假设个数为
我们的建模过程就是从2的6次方加1中选出一个更贴合数据的假设,把这个数据作为模型,对新的数据进行预测。这个假设对当前的预知度匹配度最高,用这个假设处理新的数据,得到的结论是最可靠的。实际上输入空间和输出空间映射的假设空间中寻找一种和当前提供的数据匹配度最高的一种假设,就可以得到这个模型。