Andrew Ng机器学习课程笔记--week2（多元线性回归&正规公式）

2017-08-25 936

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1. 内容概要Multivariate Linear Regression(多元线性回归)多元特征多元变量的梯度下降特征缩放Computing Parameters Analytically正规公式（Normal Equation )正规公式非可逆性（Normal Equation Noninvertibility）2. 重点&难点1）多元变量的梯度下降2）特征缩放为什么要特征缩放首先要清楚为什么使用特征缩放。

1. 内容概要

Multivariate Linear Regression(多元线性回归)
- 多元特征
- 多元变量的梯度下降
- 特征缩放
Computing Parameters Analytically
- 正规公式（Normal Equation )
- 正规公式非可逆性（Normal Equation Noninvertibility）

2. 重点&难点

1）多元变量的梯度下降

多元变量的梯度下降

2）特征缩放

为什么要特征缩放

首先要清楚为什么使用特征缩放。见下面的例子

特征缩放前

由图可以知道特征缩放前，表示面积的x1变量的值远大于x2，因此J(θ)图像表示就是椭圆的，导致在梯度下降的过程中，收敛速度非常慢。

特征缩放后

对各变量特征缩放后绘制出来的损失函数J(θ)明显收敛更快，这也是为什么需要特征缩放的原因了。

实现方法

feature scaling

$\begin{equation} x_i := \frac{x_i}{x_\max - x_\min} \end{equation}$

每个输入值除以(max - min)

mean normalization

$\begin{equation} x_i := \frac{x_i - μ_i}{s_i} \end{equation}$
μ_i: 均值
s_i: max - min

3) Normal Equation 正规方程式

Normal Equation
$\begin{equation} θ = （X^T·X）^{﹣1}·X·Y \end{equation}$

具体推理过程详见掰开揉碎推导Normal Equation

与梯度下降方法进行比较

梯度下降	正规方程式
需要选择步长α	不需要选择步长α
需要迭代训练很多次	一次都不需要迭代训练
O(kn²)	O(n³,计算(X^T·X)^-1需要花费较长时间
即使数据特征n很大，也可以正常工作	n如果过大，计算会消耗大量时间

4）正规方程不可逆

当X^T·X不可逆时，很显然此时正规方程将不能正常计算，常见原因如下：

冗余特征，在两个特点紧密相关(即它们呈线性关系，例如面积和（长，宽)这两个特征线性相关）
太多的特征(例如：m≤n)。在这种情况下，可以删除一些特征或使用"regularization"。

补充：

A是可逆矩阵的充分必要条件是 |A|≠0

Andrew Ng机器学习课程笔记--week2（多元线性回归&正规公式）

1. 内容概要

2. 重点&难点

1）多元变量的梯度下降

2）特征缩放

为什么要特征缩放

实现方法

3) Normal Equation 正规方程式

4）正规方程不可逆

MARSGGBO原创

2017-8-2

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Andrew Ng机器学习课程笔记--week2（多元线性回归&正规公式）

1. 内容概要

2. 重点&难点

1）多元变量的梯度下降

2） 特征缩放

为什么要特征缩放

实现方法

3) Normal Equation 正规方程式

4） 正规方程不可逆

MARSGGBO原创 2017-8-2

热门文章

最新文章

相关课程

相关电子书

相关实验场景

2）特征缩放

4）正规方程不可逆

MARSGGBO原创

2017-8-2