机器学习--1. 疑惑及个人见解

简介: 最近一段时间,在学习机器学习,学习过程中遇到了一些疑惑,再次记录下来,一方面梳理自己的思路,另一方面给大家分享避免踩坑,欢迎argue。。。

疑惑及个人见解

1. 《数理统计》与《概率论》

个人理解《数理统计》侧重于在样本空间上对数据进行研究,而《概率论》是在整个数据空间上研究数据特性;《数理统计》是根据局部到整体,而《概率论》直接研究整体。

2. 均值与期望

均值是《数理统计》中的含义,即研究的是样本空间上的中心点问题;期望是《概率论》上的意义,即研究的是整个数据空间上的中心点问题;因此,期望是恒定不变的,均值是沿期望波动的,而且受异常值影响较大;根据大数定理,当样本的个数趋于无穷时,均值收敛于期望,即这时,均值就是期望。

3. 独立、互斥、相关

两个事件相互独立是指两个事件发生互不影响,既可以同时发生,也可以不同时发生;互斥是指两个事件不可能同时发生,因此互斥事件一定不相互独立;相关是指两个事件发生存在依赖关系,如A的变大,B也跟着变大或变小;

4. 观察值、真实值和预测值

观察值一般指我们拿到的数据,一般是真实值的表征 ,可能存在误差,而预测值是我们根据当前数据集建立的模型的输出值。一般与真实值存在偏差,与观测值也存在偏差。

5.偏差、误差、方差,噪声

这三个最容易理解的是方差,方差表征了样本数据集围绕均值的波动情况。偏差=误差。噪声是指观察值与真实值之间的偏差,受观测方式的影响,观察值于真实值之间存在一定的偏差。

6.机器学习三要素

模型可以理解为输出函数;策略可以理解为挑选出最佳模型的方法,如损失函数+风险函数;算法可以理解为求解模型中的参数

目录
相关文章
|
6月前
|
存储 人工智能 安全
面向企业的 ChatGPT 究极手册:第七章到第八章
面向企业的 ChatGPT 究极手册:第七章到第八章
151 0
面向企业的 ChatGPT 究极手册:第七章到第八章
|
机器学习/深度学习 数据采集 PyTorch
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
208 0
|
人工智能
如何写一篇人工智能领域的期刊论文(SCI论文的固定模式和一些套路)
如何写一篇人工智能领域的期刊论文(SCI论文的固定模式和一些套路)
|
机器学习/深度学习 计算机视觉
可解释机器学习 - 李宏毅笔记
可解释机器学习 - 李宏毅笔记
|
机器学习/深度学习 数据采集 算法
机器学习算法竞赛实战--3,数据探索
数据探索可以帮助回答以上这3点,并能够保证竞赛的最佳结果,它是一种总结,可视化和熟悉数据集中重要特征的方法。数据探索有利于我们发现数据的一些特征,数据之间的关联性有助于后续的特征构建
106 0
机器学习算法竞赛实战--3,数据探索
|
机器学习/深度学习 自然语言处理 算法
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
183 0
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
|
机器学习/深度学习 人工智能 算法
当博弈论遇上机器学习:一文读懂相关理论
博弈论和机器学习能擦出怎样的火花?本文作者王子嘉通过回顾总结近年来博弈论和机器学习领域的交叉研究工作,为读者展示了这一领域最新的研究图景。
1146 0
当博弈论遇上机器学习:一文读懂相关理论
|
算法 机器学习/深度学习 BI
干货 | 关于机器学习的知识点,全在这篇文章里了
本文为大家介绍机器学习的魅力与可怕。
3898 0
|
机器学习/深度学习 算法 大数据
吐血整理:机器学习的30个基本概念,都在这里了(手绘图解)
导读:本文主要介绍机器学习基础知识,包括名词解释(约30个)、基础模型的算法原理及具体的建模过程。
|
机器学习/深度学习 算法 传感器
独家 | 一文读懂统计学与机器学习的本质区别(附案例)
本文为你讲解了统计学与机器学习的本质区别。
1501 0
下一篇
无影云桌面