机器学习的基本概念-2| 学习笔记

简介: 快速学习机器学习的基本概念-2。

开发者学堂课程【机器学习算法 :机器学习的基本概念-2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7167


机器学习的基本概念-2

 

内容介绍

一、假设空间的概念

二、假设空间的历史

三、假设空间的讲解

 

一、假设空间的概念

假设空间( Hypothesis Space):由输入空间到输出空间的映射的集合 ,称作假设空间。

 

二、假设空间的历史

监督学习的目的在于学习一个由输入到输出的映射,这一映射由模型来表示。换句话说,学习的目的就在于找到最好的这样的横型。模型展于由输入空间到输出空间的映射集合,这个集合就是假设空间。假设空间的确定意味着学习范围的确定。

-李航《统计学习方法〉

The hypothesis space, which defines the class of functions mapping the input space to th

e output space. That is, the functions operate on the feature vectors of the input object

s, and make predictions according to the format of the output space.

-李铁岩 Learning to Rank tor Information Retrieval

假设空间指的是问题所有假设组成的空间,我们可以把学习过程看作是在假设空间中搜索的过程,搜索目标是寻找与训练集”匹配”的假设。

一周志华《机器学习》

《机器学习》不适合基础操作,适合有一定进阶,系统化已有流程知识。

《统计学习方法》从统计的方面学习

 

三、假设空间的讲解

例如:

某商品的浏览、购买记录中,记录了性别、信用度及是否购买,基于数据建模。其中 性别 Gender 取值为 { Female,Male },Credit 取值为 { High, Mediun, Low ],Buy 的取值为{ TRUE, FALSE)

图片6.png

Gender 、Credit 是输入空间,不做映射就是特征空间。Buy 是输出空间。

在输入空间和输出空间之间建立映射关系,即假设空间。

输入记录中所有可能出现的值的组合为(不重复) 2x3=6个,列表如下:

图片7.png

上述每个组和最终都可能有(最多)两个,即 true 或 false:

图片8.png

上表是否为假设空间?

针对每一种的输入,都能找到一个映射,对应了输出空间中某个输出。

图片9.png

以上是12条记录:

female 和 high 可能有两种输出:true 或者 false;假设每一个都选择一个输出。6个输出空间对应了一个输出结果。

图片10.png

这个东西我们称为一个假设。假设为 h,i 为下标。

所有的输入空间对应一个结果,叫做假设。这是一种映射方式。

针对每一种可能的输入,都能找到一个映射,对应了输出空间中某个输出。

算一下总共可能出现的假设 hi 个数:

图片11.png

都一条:female 和 high 只有两种可能 true 或 false;两种取法

下面的5者都是有两种取法。

总共可能出现的假设个数 hi 个球数:就是将取法乘起来。

通常我们会加上一个特殊的假设,全空,即2的6次方加1

更一般的,假设空间H中的假设个数为

图片12.png

图片13.png

我们的建模过程就是从2的6次方加1中选出一个更贴合数据的假设,把这个数据作为模型,对新的数据进行预测。这个假设对当前的预知度匹配度最高,用这个假设处理新的数据,得到的结论是最可靠的。实际上输入空间和输出空间映射的假设空间中寻找一种和当前提供的数据匹配度最高的一种假设,就可以得到这个模型。

相关文章
|
6月前
|
机器学习/深度学习 人工智能 算法
详解机器学习概念、算法
详解机器学习概念、算法
详解机器学习概念、算法
|
1月前
|
机器学习/深度学习 自然语言处理 JavaScript
信息论、机器学习的核心概念:熵、KL散度、JS散度和Renyi散度的深度解析及应用
在信息论、机器学习和统计学领域中,KL散度(Kullback-Leibler散度)是量化概率分布差异的关键概念。本文深入探讨了KL散度及其相关概念,包括Jensen-Shannon散度和Renyi散度。KL散度用于衡量两个概率分布之间的差异,而Jensen-Shannon散度则提供了一种对称的度量方式。Renyi散度通过可调参数α,提供了更灵活的散度度量。这些概念不仅在理论研究中至关重要,在实际应用中也广泛用于数据压缩、变分自编码器、强化学习等领域。通过分析电子商务中的数据漂移实例,展示了这些散度指标在捕捉数据分布变化方面的独特优势,为企业提供了数据驱动的决策支持。
53 2
信息论、机器学习的核心概念:熵、KL散度、JS散度和Renyi散度的深度解析及应用
|
1月前
|
机器学习/深度学习 传感器 算法
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
|
6月前
|
机器学习/深度学习 自然语言处理 算法
|
3月前
|
机器学习/深度学习 算法 搜索推荐
【机器学习】机器学习的基本概念、算法的工作原理、实际应用案例
机器学习是人工智能的一个分支,它使计算机能够在没有明确编程的情况下从数据中学习并改进其性能。机器学习的目标是让计算机自动学习模式和规律,从而能够对未知数据做出预测或决策。
87 2
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习、分类问题和逻辑回归的基本概念、步骤、特点以及多分类问题的处理方法
机器学习是人工智能的一个核心分支,它专注于开发算法,使计算机系统能够自动地从数据中学习并改进其性能,而无需进行明确的编程。这些算法能够识别数据中的模式,并利用这些模式来做出预测或决策。机器学习的主要应用领域包括自然语言处理、计算机视觉、推荐系统、金融预测、医疗诊断等。
61 1
|
3月前
|
机器学习/深度学习 算法
【机器学习】解释对偶的概念及SVM中的对偶算法?(面试回答)
解释了对偶的概念,指出对偶性在优化问题中的重要性,尤其是在强对偶性成立时可以提供主问题的最优下界,并且详细阐述了支持向量机(SVM)中对偶算法的应用,包括如何将原始的最大间隔优化问题转换为对偶问题来求解。
77 2
|
3月前
|
机器学习/深度学习
【机器学习】准确率、精确率、召回率、误报率、漏报率概念及公式
机器学习评估指标中的准确率、精确率、召回率、误报率和漏报率等概念,并给出了这些指标的计算公式。
532 0
|
3月前
|
机器学习/深度学习 算法 搜索推荐
【机器学习】凸集、凸函数、凸优化、凸优化问题、非凸优化问题概念详解
本文解释了凸集、凸函数、凸优化以及非凸优化的概念,并探讨了它们在机器学习中的应用,包括如何将非凸问题转化为凸问题的方法和技术。
216 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之深度学习算法概念
深度学习算法是一类基于人工神经网络的机器学习方法,其核心思想是通过多层次的非线性变换,从数据中学习表示层次特征,从而实现对复杂模式的建模和学习。深度学习算法在图像识别、语音识别、自然语言处理等领域取得了巨大的成功,成为人工智能领域的重要技术之一。
88 3
下一篇
无影云桌面