梯度下降【无约束最优化问题】(二)

简介: 本文属于 线性回归算法【AIoT阶段三】(尚未更新),这里截取自其中一段内容,方便读者理解和根据需求快速阅读。本文通过公式推导+代码两个方面同时进行,因为涉及到代码的编译运行,如果你没有NumPy,Pandas,Matplotlib的基础,建议先修文章:数据分析三剑客【AIoT阶段一(下)】(十万字博文 保姆级讲解),本文是梯度下降的第一部分,后续还会有:三种梯度下降方法与代码实现,梯度下降优化,梯度下降优化进阶 (暂未更新)

5.全局最优化

15.png

🚩上图显示了梯度下降的两个主要挑战:

  • 若随机初始化,算法从左侧起步,那么会收敛到一个局部最小值,而不是全局最小值;
  • 若随机初始化,算法从右侧起步,那么需要经过很长时间才能越过Plateau(函数停滞带,梯度很小),如果停下得太早,则永远达不到全局最小值;


而线性回归的模型 MSE 损失函数恰好是个凸函数,凸函数保证了只有一个全局最小值,其次是个连续函数,斜率不会发生陡峭的变化,因此即便是乱走,梯度下降都可以趋近全局最小值。


上图损失函数是非凸函数,梯度下降法是有可能落到局部最小值的,所以其实步长不能设置的太小太稳健,那样就很容易落入局部最优解,虽说局部最小值也没大问题, 因为模型只要是堪用的就好嘛,但是我们肯定还是尽量要奔着全局最优解去


6.梯度下降步骤

🚩梯度下降流程就是“猜”正确答案的过程:

image.png

image.png

7.代码模拟梯度下降

  • 梯度下降优化算法,比正规方程,应用更加广泛
  • 什么是梯度?
  • 梯度就是导数对应的值!
  • 下降?
  • 涉及到优化问题,最小二乘法
  • 梯度下降呢?
  • 梯度方向下降,速度最快的~


接下来,我们使用代码来描述上面梯度下降的过程:

方程如下:

image.png

image.png

7.1 构建函数和导函数

import numpy as np
import matplotlib.pyplot as plt
# 构建方程
f = lambda x : (x - 3.5) ** 2 - 4.5 * x + 10
# 方程的导函数
g = lambda x : 2 * (x - 3.5) - 4.5

7.2 函数可视化

# 绘制函数图像
x = np.linspace(0, 11.5, 100)
y = f(x)
_ = plt.plot(x, y)

image.png

7.3 求函数的最小值

7.3.1 导函数可解

'''
 2 * (x - 3.5) - 4.5 = 0
 2 * x = 11.5
 x = 5.75
'''
_ = plt.plot(x, y)
_ = plt.scatter(5.75, f(5.75), color = 'red') # 红点就是最小值

image.png

7.3.2 导函数不可解(梯度下降)

eta = 0.1  # 学习率
precision = 0.0001  # 设置精度
# 瞎蒙(随机)一个初始值
x = np.random.randint(0, 12)
print('随机的值:x =', x)
# 下面会进行多次 while 循环执行梯度下降
# 每次都要更新 last_x,记录上一次的值
# last_x 赋初值的时候要与 x 略微不同,赋值大于精度即可
last_x = x + 0.1
# x_ 就是每次梯度下降求解出的 x 值,一开始为 x 的初值
x_ = [x]
cnt = 0
while True:
    if np.abs(x - last_x) < precision:
        break
    # 根据梯度下降进行更新
    cnt += 1
    last_x = x
    x = x - eta * g(x)
    x_.append(x)
print('梯度下降的次数为:', cnt)
print('算出的结果:x =', x)
# 绘图
x1= np.linspace(0, 11.5, 100)
y = f(x1)
_ = plt.plot(x1, y)
x_ = np.array(x_)
_ = plt.scatter(x_, f(x_), color = 'red')

16.png




目录
相关文章
|
人工智能 文字识别 监控
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
17659 0
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
|
10月前
|
监控 开发工具 Android开发
ARMS 用户体验监控正式发布原生鸿蒙应用 SDK
阿里云 ARMS 用户体验监控(RUM)推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发,支持页面采集、资源加载采集、异常采集及自定义采集等功能,能够全面监控鸿蒙应用的表现。集成简单,只需几步即可将 SDK 接入项目中,为鸿蒙应用的开发者提供了强有力的支持。
482 112
|
10月前
|
存储 自然语言处理 Unix
【C语言】C语言 4 个编译过程详解
编译是将源代码转换为目标代码的过程。它是在编译器的帮助下完成的。编译器检查源代码是否存在语法或结构错误,如果源代码没有错误,则生成目标代码。
372 1
|
Java Windows
[main] DEBUG Sigar - no sigar-amd64-winnt.dll in java.library.path org.hyperic.sigar.SigarException:
[main] DEBUG Sigar - no sigar-amd64-winnt.dll in java.library.path org.hyperic.sigar.SigarException:
280 1
|
API 算法框架/工具 异构计算
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
|
应用服务中间件 nginx
重定向和反向代理的区别
重定向和反向代理的区别
524 0
|
自然语言处理 JavaScript Java
天猫精灵开放平台体验创建语音技能
天猫测评活动——创建一个语音技能的真实操作流程记录
天猫精灵开放平台体验创建语音技能
|
Cloud Native 虚拟化 Docker
【云原生】Docker安装,告别报错
【云原生】Docker安装,告别报错
259 0
【云原生】Docker安装,告别报错
开发指南—函数—聚合函数
本文介绍了PolarDB-X支持及不支持的聚合函数。
100 0