备案控制台

开发者社区人工智能文章正文

概率视角的Linear Regression

2022-11-22 75

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 概率视角的Linear Regression

机器学习：概率视角的Linear Regression

前言

上一节我们说到了一元线性回归·与·多元线性回归，大家如果还不清楚，可以去考古。
之前，我们用最小二乘估计，推导出来：

在这一小节中，我采取概率的视角来解决线性回归问题。

推导过程

在这里插入图片描述
还是这一张图，我们可以发现，如果让拟合的直线与每个观测值x的距离都为0，也就是误差为0，但是这情况是不会出现的，因为数据本身就具有不确定性，带有一定的噪声。如果真有这种情况，这个模型也没有任何意义，只能解决特定问题。

结论归纳

求到最后，我们可以看出，这与之前讲过的最小二乘估计的Cost function是一致的，可以得出结论最小二乘估计隐含了噪声服从正态的假设，从概率角度的MLE（极大似然估计）与MSE（最小二乘估计）本质是一样的。

文章标签：

机器学习/深度学习

HanZee

目录

相关文章

拓端数据部落

|

2天前

|

数据可视化 Python

Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING,GBR回归训练和预测可视化

Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING,GBR回归训练和预测可视化

拓端数据部落

29 0 0

Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING,GBR回归训练和预测可视化

拓端数据部落

|

2天前

|

机器学习/深度学习算法数据可视化

样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

拓端数据部落

14 0 0

拓端数据部落

|

2天前

|

资源调度并行计算算法

R语言马尔可夫区制转移模型Markov regime switching

R语言马尔可夫区制转移模型Markov regime switching

拓端数据部落

20 0 0

拓端数据部落

|

2天前

广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证

广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证

拓端数据部落

5 0 0

拓端数据部落

|

2天前

R语言stan泊松回归Poisson regression

R语言stan泊松回归Poisson regression

拓端数据部落

19 1 1

revolution2u

|

Python 机器学习/深度学习

Cross Entropy Loss 交叉熵损失函数公式推导

表达式输出标签表示为{0,1}时，损失函数表达式为： $L = -[y log \hat{y} + (1-y)log(1- \hat{y})]$ 二分类二分类问题，假设 y∈{0,1} 正例：$P(y = 1| x) = \hat{y}$ 反例：$P(y=0|x) = 1-\hat{y}$ 取似然函数似然函数就是所有样本在参数θ下发生概率最大的那种情况，由于样本独立同分布，因此概率最大的情况就是每个样本发生概率的连乘。

revolution2u

15601 0 3

游客nekoul5qfopxi

|

机器学习/深度学习算法 Python

机器学习算法之——梯度提升（Gradient Boosting）上

由于每个子模型要使用全部的数据集进行训练，因此 Ada Boosting 算法中没有 oob 数据集，在使用 Ada Boosting 算法前，需要划分数据集：train_test_split；

游客nekoul5qfopxi

165 0 0

机器学习算法之——梯度提升（Gradient Boosting）上

游客nekoul5qfopxi

|

机器学习/深度学习算法

机器学习算法之——梯度提升（Gradient Boosting）下

GDBT本身并不复杂，不过要吃透的话需要对集成学习的原理、策树原理和各种损失函树有一定的了解。由于GBDT的卓越性能，只要是研究机器学习都应该掌握这个算法，包括背后的原理和应用调参方法。目前GBDT的算法比较好的库是xgboost。当然scikit-learn也可以。

游客nekoul5qfopxi

259 0 0

机器学习算法之——梯度提升（Gradient Boosting）下

heda3

|

机器学习/深度学习算法

线性回归（Linear regression）算法

属于有监督学习、判别模型、有预测函数、有优化目标，有优化求解算法

heda3

257 0 1

艾派森_

|

算法 Python

利用python实现Ridge岭回归和Lasso回归

利用python实现Ridge岭回归和Lasso回归

艾派森_

281 0 0

利用python实现Ridge岭回归和Lasso回归

热门文章

最新文章

MySQL数据库重命名的方法

CVE-2017-9805:Struts2 REST插件远程执行命令漏洞(S2-052) 分析报告

阿里云播放器SDK的正确打开方式 | 功能、架构与应用（一）

流言终结者- Flutter和RN谁才是更好的跨端开发方案？

Linux 多核下绑定硬件中断到不同 CPU（IRQ Affinity）

PostgreSQL 聚合函数讲解 - 3 总体|样本方差, 标准方差

利用Serverless Kubernetes和Kaniko快速自动化构建容器镜像

袋鼠云数据中台专栏（五）：数栈，企业级一站式数据中台PaaS

企业微信开发（二）：API对接及Demo程序

一篇文章深入浅出带你了解mybatis

如果使用已经到达 End of life 的 Angular 版本会遇到什么问题

印刷文字识别产品使用合集之部署失败如何解决

印刷文字识别产品使用合集之API接口无法调用如何解决

什么是计算机图形领域的 color saturation

dex、vdex、.odex与.oat

java调用kotlin代码编译报错“找不到符号”的问题

印刷文字识别产品使用合集之身份证识别接口有哪些

Build was configured to prefer settings repositories over project repositories but repository

Java注解之编译时注解

相关课程

更多

【算法实战】11. K-Means（K-均值）聚类算法

【算法实战】9. 线性回归算法

【算法实战】5. Logistic回归算法

【算法实战】14. 利用PCA来简化数据

相关电子书

更多

优势特征蒸馏(Privileged Features Distillation)在手淘信息流推荐中的应用

低代码开发师（初级）实战教程

阿里巴巴DevOps 最佳实践手册

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考