回归分析概述 | 学习笔记

简介: 快速学习回归分析概述

开发者学堂课程【人工智能必备基础:概率论与数理统计:回归分析概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7428


回归分析概述

内容介绍:

一、 回归分析

二、 回归的一般步骤

 

一、回归分析

相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法

回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法
在对回归分析进行分类时,主要有两种分类方式:
●根据变量的数目,可以分类一元回归、多元回归(一元回归:比如有个 Y,X。X 会对 Y 产生一个影响,Y 只由 X 一个因素影响而改变的。多元回归:比如有 Y、X0、X1、X2,变量很多,但因变量只有一个 Y。)
●根据自变量与因变量的表现形式,分为线性与非线性(基本线性表达:y=kx+b。还有 y=kx^2+b,以及二阶的,三阶的,四阶的……)
所以,回归分析包括四个方向:一元线性回归分析、 多元线性回归分析、一元非线性回归分析、多元非线性回归分析。

image.png

解读上图:球里有些数据点(红色方块),现要围绕已知的数据点建立出一个回归方程,这个回归方程能把这些数据点综合进去,这就是回归分析里的主要的事。假如把回归方程(紫色线)构建出来,有些点在紫色线的上面,有些在紫色线的下面,这就是离散情况,既分布在回归方程两端。在回归方程上的点叫做估计值或预测值,基于方程的点,在方程上的点是预测值。比如想要知道一个指标,现横坐标和纵坐标分别表示体重和身高,现当体重等于 68,这类人身高大约为多少。按照方程,现将方程求出,在把 x=68 代入就能求出 y 等于多少,对于方程就是求出的预测点,下面的红色方块就是观测值,观测值和估计值之间有差异的,这个差异值叫做残差或误差项。weight=-134+4.09height 就是构造出来的紫色回归方程,紫色回归方程就能预测出更多的值,就好比做一件事,基于历史数据当中,找到变量之间的关系,因变量与自变量之间的关系,由这关系大致能把方程构建出来。对于方程来说,不可能都过每一个点,都会有偏差。假如当有一个数据,只知道体重,就用回归方程预测出大致的身高,或者体重。这就是回归方程能帮助做的事。

 

二、回归分析的一般步骤

1、 确定回归方程中的解释变量和被解释变量

2、 确定回归模型建立回归方程

3、 对回归方程进行各种检验

4、 利用回归方程进行预测

相关文章
|
3月前
|
机器学习/深度学习 数据可视化 算法
经典时间序列分析概述:技术、应用和模型
时间序列数据按时间顺序收集,具有时间维度的重要性,需专门技术和模型进行分析预测。其应用广泛,涵盖经济预测、风险管理、天气预报、气候建模、流行病学、患者监测、需求预测、客户行为分析及预测性维护等领域。时间序列特征包括趋势、季节性和周期性模式。自相关和偏自相关用于衡量数据点间关系,白噪声表示无自相关的时间序列。平稳性指统计特性随时间保持一致,对建模至关重要。常见模型包括ARMA、ARIMA、SARIMA、ARCH和GARCH,用于捕捉复杂动态并预测未来模式。选择合适模型和确定顺序对准确预测至关重要。掌握这些基础知识不仅增强对复杂模型的理解,还能确保预测方法的稳健性和可靠性。
132 1
经典时间序列分析概述:技术、应用和模型
|
7月前
|
机器学习/深度学习 自然语言处理 算法
|
6月前
|
机器学习/深度学习 存储 算法
机器学习之聚类——双聚类简介及简单案例
机器学习之聚类——双聚类简介及简单案例
82 0
|
7月前
|
机器学习/深度学习 算法 Python
LightGBM高级教程:时间序列建模
LightGBM高级教程:时间序列建模【2月更文挑战第7天】
411 0
|
机器学习/深度学习 算法 数据挖掘
[笔记]机器学习之机器学习理论及案例分析《二》 聚类
[笔记]机器学习之机器学习理论及案例分析《二》 聚类
128 0
|
机器学习/深度学习 算法 数据可视化
机器学习基础——k-近邻算法概述和简单实现
本章介绍第一个机器学习算法:k-近邻算法,它非常有效而且易于掌握。首先,我们将探讨k-近邻算法的基本理论,以及如何使用距离测量的方法分类物品;其次我们将使用Python从文本文件中导人并解析数据。
184 0
机器学习基础——k-近邻算法概述和简单实现
|
机器学习/深度学习 测试技术 计算机视觉
9个数据科学中常见距离度量总结以及优缺点概述(下)
9个数据科学中常见距离度量总结以及优缺点概述
452 0
9个数据科学中常见距离度量总结以及优缺点概述(下)
|
算法 搜索推荐 测试技术
9个数据科学中常见距离度量总结以及优缺点概述(上)
9个数据科学中常见距离度量总结以及优缺点概述
408 0
9个数据科学中常见距离度量总结以及优缺点概述(上)
|
机器学习/深度学习 算法 数据挖掘
分类算法概述 下|学习笔记
快速学习分类算法概述 下
分类算法概述 下|学习笔记
|
机器学习/深度学习 算法 数据挖掘
分类算法概述 上|学习笔记
快速学习分类算法概述 上
分类算法概述 上|学习笔记

热门文章

最新文章