备案控制台

开发者社区阿里云开发者学堂文章正文

参数估计-3| 学习笔记

2022-11-11 127

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习参数估计-3。

开发者学堂课程【机器学习算法：参数估计-3】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/535/detail/7223

参数估计-3

内容介绍

一、梯度算法流程

二、牛顿迭代法

三、逻辑回归的基本假设

四、逻辑回归案例：鸢尾花数据集

五、逻辑回归案例：BGA

六、多分类逻辑回归

一、梯度算法流程

1.批量梯度上升(下降)法的算法流程:

首先要设定一个学习率，给回归参数指定一个初始化的值，有了初始化的值才能根据更新公式去更新。

初始化值:回归参数、学习率等重复执行，直到满足循环次数:

计算当前参数下样本的估计值，计算估计值和真实值的差，判断是否可以退出。如果这个差可以小于设定的阈值就退出，否则的话就要计算梯度。

计算梯度

按照梯度和学习率更新回归参数返回回归系数值

2.随机梯度上升(下降)法的算法流程:

初始化值:回归参数、学习率等重复执行，直到满足循环次数:

对一个(小批次)样本

计算当前参数下样本的估计值，计算估计值和真实值的差，判断是否可以退出。

计算梯度

按照梯度和学习率更新回归参数

返回回归系数值

二、牛顿迭代法

牛顿迭代法(Newton's Method)通过不断求切线迭代求解函数方程根的办法。

已知待解方程 f(x)=0，求解其方程根。

随机找到定义域中的值计算其对应的值f( )，如果If( )-f(x)I<ε，得到解

否则:计算过点( ，f( ))的f(x)切线斜率f´( )

写出该切线的点斜式：f(x)-f( )=f´( )*(x- )

求切线和 x 轴的交点，即解方程：-f( )=f´( )*(x- )

记得到的解为，其迭代公式为：

通常比更接近方程f(x)=0的解，使用迭代方式继续迭代。

首先找到并求值，然后找到它的切线，和 x 轴的交点就是下一个值，就这样迭代下去一直到满足循环次数或者是算出来的函数值和原函数值的差小于预先设定的阈值。

三、逻辑回归的基本假设

因变量为二分类的分类变量或某事件的发生率，并且是数值型变量。

残差和因变量都要服从二项分布，二项分布对应的是分类变量，所以不是正态分布，进而不是用最小二乘法，而是最大似然法来解决方程估计和检验问题。

自变量和 Logistic 概率是线性关系。当把这个因变量的分类变量转化成 Logistic 函数，它和自变量就是线性关系了。

各观测对象间相互独立，共线性问题会影响逻辑回归的参数估计和预测。如果不相互独立，那前面的最大似然函数就不能用了。

四、逻辑回归案例：鸢尾花数据集

鸢尾花有三种，有山鸢尾、杂色鸢尾和维吉尼亚鸢尾。因为做的是二分类，所以只取其中的两类数据。其中把山鸢尾记作是0，杂色鸢尾记作是1。

只使用两个类的数据，其中每类40条用于训练，10条用于测试。整个训练数据集共有80条数据，测试数据集有20条数据。

五、逻辑回归案例：BGA

根据数据和任务说明：，其中

这里的 y 就是0和1，或者是0发生的概率和1发生的概率的比值。假设当前参数的初始值为1，学习率就是步长为0.01，最大循环次数为10000次，当前循环次数是1，要对它进行初始化。所有的 β 参数设成是1，一旦满足了最大循环次数就退出。

计算当前参数下的估计值(以4条数据为例)：因为数据量比较大，不太容易展示。

计算梯度：

= + +

按梯度更新回归参数：

当前参数取值：β=

计算梯度：

= * =

按梯度更新回归参数：

= =

这个时候的值已经接近实际结果了。

通过误差大小控制，退出循环，例如要求误差 ε≤0.05，currLoop=426

使用测试数据预测：

小于0.5就认为是0，大于0.5就认为是1，实际上这个预测的结果和数据的结果是一样的。这就是手工使用逻辑回归小数据集来更新参数去算模型以及使用这个模型做预测的整个过程。

六、多分类逻辑回归

如果处理合适的话，这个逻辑回归也可以处理多分类的情形。比如取值为a，b,c，d，e。要对 a 来讲的话，如果记录取 a 就认为它等于1，取其它的值就认为它等于0。

当因变量的取值数超过2个时，即转化为多分类回归问题。两种常见解决办法:

构建多个二分类逻辑回归模型，即对每一个取值，都构建一个(1，0)的二分类逻辑回归模型。指定一个取值为参照类，其余类型和参照类逐个进行回归。假设有k个取值，设第k个为参照类，则需要建立以下k-1个逻辑回归模型:

整理得到：

概率和归一：

使用 softmax 作为损失函数。Softmax 适用于多分类，将输出映射到(0,1)区间内，含义为属于当前分类的概率。

其公式为：

比如多分类，每个分类的取值概率，如果直接取 max 值的话，每次只有最大的有机会出现。Softmax 就是按照每一个分类对应的值的大小让每一个分类都有机会输出。Softmax 的应用是非常广的，特别是适用于多分类。如果想弄清楚多分类的逻辑回归的话，还可以使用数据集。

文章标签：

机器学习/深度学习

算法

开发者

带你读小助手

目录

相关文章

aliyun1645995785-22449

|

7月前

|

算法

【数理统计实验（二）】参数估计

【数理统计实验（二）】参数估计

aliyun1645995785-22449

55 2 2

拓端数据部落

|

7月前

|

算法

R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

拓端数据部落

49 0 0

小小何先生

|

机器学习/深度学习资源调度并行计算

经典机器学习系列(一)【贝叶斯分类、最大似然估计、最大后验概率估计】

经典机器学习系列(一)【贝叶斯分类、最大似然估计、最大后验概率估计】

小小何先生

229 0 0

宋wz

概率论笔记（二）概率分布

概率论笔记（二）概率分布

宋wz

101 0 0

爱睡觉的咋

|

机器学习/深度学习算法 Python

机器学习中的数学原理——对数似然函数

机器学习中的数学原理——对数似然函数

爱睡觉的咋

884 0 0

机器学习中的数学原理——对数似然函数

壹佰、

|

机器学习/深度学习人工智能资源调度

【机器学习】线性回归——最小二乘法的概率解释高斯噪声（理论+图解+公式推导）

【机器学习】线性回归——最小二乘法的概率解释高斯噪声（理论+图解+公式推导）

壹佰、

316 0 0

【机器学习】线性回归——最小二乘法的概率解释高斯噪声（理论+图解+公式推导）

壹佰、

|

机器学习/深度学习人工智能移动开发

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

壹佰、

395 0 0

【机器学习】线性分类——高斯判别分析GDA（理论+图解+公式推导）

heda3

|

BI

统计学习--最大似然和贝叶斯估计的联系

概率是已知模型和参数，推数据；统计是已知数据，推模型和参数

heda3

127 0 0

统计学习--最大似然和贝叶斯估计的联系

带你读小助手

|

机器学习/深度学习算法开发者

参数估计-2| 学习笔记

快速学习参数估计-2。

带你读小助手

185 0 0

带你读小助手

|

机器学习/深度学习算法开发者

参数估计-1| 学习笔记

快速学习参数估计-1。

带你读小助手

122 0 0

阿里云开发者学堂

热门文章

最新文章

四大触点，教你从“用户视角”构建数据分析体系

《Stata统计分析与应用（第2版）》一3.4 图形的保存、合并及修改

Spring-boot+Dubbo应用启停源码分析

分享一些OpenStack的qcow2格式实例镜像

基于区块链的机器学习模型创建方案

微信web开发者工具无法打开的六种解决方法

RocketMq-Request-Reply消息

[译] 构建世界上最快的会议网站

" "(双引号)与 ' '(单引号)的区别

自定义高效支持点击监听的RecyclerView

AI在电子商务中的个性化推荐系统：驱动用户体验升级

基于AI的网络流量分析：构建智能化运维体系

鸿蒙登录页面好看的样式设计-HarmonyOS应用开发实战与ArkTS代码解析【HarmonyOS 5.0（Next）】

HarmonyOS 5.0 （Next）应用开发实战：使用ArkTS构建开箱即用的登录页面【HarmonyOS 5.0（Next）】

开箱即用的个人主页页面开发实战—基于HarmonyOS 5.0 （Next）和ArkTS的实现【HarmonyOS 5.0（Next）】

《Java 在 3D 视觉与重建领域：开启无限可能之旅》

《Java 情感分析：前沿技术与方法全解析》

《GraalVM：Java AI 应用性能与启动速度的优化利器》

《探索 Apache Spark MLlib 与 Java 结合的卓越之道》

云产品评测

相关课程

更多

南瓜书《机器学习公式推导》

机器学习基础与回归算法

相关电子书

更多

ADMM

概率图模型

纯干货 | 机器学习中梯度下降法的分类及对比分析

相关实验场景

更多

推荐系统入门之使用ALS算法实现打分预测

下一篇

【案例实战】SpringBoot整合阿里云文件上传OSS