机器学习--1. 疑惑及个人见解

简介: 最近一段时间,在学习机器学习,学习过程中遇到了一些疑惑,再次记录下来,一方面梳理自己的思路,另一方面给大家分享避免踩坑,欢迎argue。。。

疑惑及个人见解

1. 《数理统计》与《概率论》

个人理解《数理统计》侧重于在样本空间上对数据进行研究,而《概率论》是在整个数据空间上研究数据特性;《数理统计》是根据局部到整体,而《概率论》直接研究整体。

2. 均值与期望

均值是《数理统计》中的含义,即研究的是样本空间上的中心点问题;期望是《概率论》上的意义,即研究的是整个数据空间上的中心点问题;因此,期望是恒定不变的,均值是沿期望波动的,而且受异常值影响较大;根据大数定理,当样本的个数趋于无穷时,均值收敛于期望,即这时,均值就是期望。

3. 独立、互斥、相关

两个事件相互独立是指两个事件发生互不影响,既可以同时发生,也可以不同时发生;互斥是指两个事件不可能同时发生,因此互斥事件一定不相互独立;相关是指两个事件发生存在依赖关系,如A的变大,B也跟着变大或变小;

4. 观察值、真实值和预测值

观察值一般指我们拿到的数据,一般是真实值的表征 ,可能存在误差,而预测值是我们根据当前数据集建立的模型的输出值。一般与真实值存在偏差,与观测值也存在偏差。

5.偏差、误差、方差,噪声

这三个最容易理解的是方差,方差表征了样本数据集围绕均值的波动情况。偏差=误差。噪声是指观察值与真实值之间的偏差,受观测方式的影响,观察值于真实值之间存在一定的偏差。

6.机器学习三要素

模型可以理解为输出函数;策略可以理解为挑选出最佳模型的方法,如损失函数+风险函数;算法可以理解为求解模型中的参数

目录
相关文章
|
机器学习/深度学习 数据采集 PyTorch
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
227 0
|
机器学习/深度学习
机器学习面试重点
机器学习面试重点
176 0
|
机器学习/深度学习 计算机视觉
可解释机器学习 - 李宏毅笔记
可解释机器学习 - 李宏毅笔记
|
机器学习/深度学习 数据采集 算法
机器学习算法竞赛实战--3,数据探索
数据探索可以帮助回答以上这3点,并能够保证竞赛的最佳结果,它是一种总结,可视化和熟悉数据集中重要特征的方法。数据探索有利于我们发现数据的一些特征,数据之间的关联性有助于后续的特征构建
112 0
机器学习算法竞赛实战--3,数据探索
|
机器学习/深度学习 自然语言处理 算法
机器学习:基础面试知识点
机器学习:基础面试知识点
238 0
机器学习:基础面试知识点
|
机器学习/深度学习 自然语言处理 算法
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
191 0
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
|
机器学习/深度学习 人工智能 算法
当博弈论遇上机器学习:一文读懂相关理论
博弈论和机器学习能擦出怎样的火花?本文作者王子嘉通过回顾总结近年来博弈论和机器学习领域的交叉研究工作,为读者展示了这一领域最新的研究图景。
1189 0
当博弈论遇上机器学习:一文读懂相关理论
|
机器学习/深度学习 分布式计算 并行计算
【好书推荐】推荐一份从入门到进阶的机器学习书单
【好书推荐】推荐一份从入门到进阶的机器学习书单
【好书推荐】推荐一份从入门到进阶的机器学习书单
|
算法 机器学习/深度学习 BI
干货 | 关于机器学习的知识点,全在这篇文章里了
本文为大家介绍机器学习的魅力与可怕。
3903 0
|
机器学习/深度学习 分布式计算 算法
一文总结机器学习类面试问题与思路
7月9日 19:00-21:30 阿里云开发者社区首场“Offer 5000”直播开启!15位团队技术大牛在线招人,更有《阿里云技术面试红宝书》助你拿下Offer!马上投递简历:https://developer.aliyun.com/special/offerday01
2725 1