Python-简单的线性回归模型

简介: 线性回归模型

在Python中使用线性回归算法

Scikit-Learn 涵盖了主流的机器学习算法,我们先介绍常用的几个库:

  • lienar_model:线性模型算法库,包括Logistic回归算法等;
  • neighbors:最邻近算法库;
  • naive-bayes:朴素贝叶斯算法库;
  • tree:决策树算法;
  • svm:支持向量机算法;
  • neural_network:神经网络算法。

如下,简单解释线性回归算法。其数学表达式如下:
$$\boldsymbol{\hat y} = \boldsymbol{W} \boldsymbol{x}$$

# 导入所需库
import numpy as np
from matplotlib import pyplot as plt
# 模拟数据集
x= np.linspace(-10, 10, 20)
segma= np.random.randn(20)
y= 3* x+ segma
# 数据图
plt.scatter(x, y)
plt.show()

在这里插入图片描述

同时,此处对线性回归算法进行简单的解释。

# 从Scikit-Learn库导入线性回归算法
from sklearn import linear_model
# x训练线性回归模型
model= linear_model.LinearRegression()
model.fit(X, y)
# 进行预测
model.predit(x_)

如果此时直接将我们上面的得到的x,y传入模型,代码会提示数据维度错误,这是因为Scikit-Learn中线性回归算法中的fit()方法需要传入x和y两组矩阵,即:
$$x: [[样本1],...,[样本n]]$$
$$y: [[样本1],...,[样本n]]$$
下面,我们可以利用的Python的List将序列变成矩阵。

X= [[i] for i in x]
y= [[i] for i in y]
from sklearn import linear_model
model= linear_model.LinearRegression()
model.fit(X, y)
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

这样,我们就得到了算法所需的正确数据格式。但是,为了检验训练的结果,我们还需要一组测试用的x_。

x_= [[1], [2]]
y_= model.predict(x_)
y_
array([[2.8780171 ],
       [5.90230701]])

我们可以通过display函数通过model.intercept和model.coef查看截距和$\boldsymbol{W}$.

display(model.intercept_)  #截距
display(model.coef_)  #线性模型的系数
array([-0.1462728])



array([[3.02428991]])

我们还可以可视化模型的拟合效果。

y__= model.predict(X)
plt.scatter(x, y__)
plt.plot(X, y__, 'g-')
plt.show()

在这里插入图片描述

以上便是一次完整的简单的线性回归过程。

下面,我们讨论线性回归算法的优缺点:

优缺点 描述
优点 简单,容易理解和实现,可解释性强
缺点 表达复杂模型时不理想,且对非线性问题表现不好
应用场景 金融、气象等
目录
相关文章
|
10天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品加工优化的深度学习模型
使用Python实现智能食品加工优化的深度学习模型
104 59
|
5天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品市场预测的深度学习模型
使用Python实现智能食品市场预测的深度学习模型
30 5
|
6天前
|
机器学习/深度学习 算法 数据可视化
使用Python实现深度学习模型:智能食品配送优化
使用Python实现深度学习模型:智能食品配送优化
22 2
|
5天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
21 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
5天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
25 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
11天前
|
机器学习/深度学习 数据采集 数据库
使用Python实现智能食品营养分析的深度学习模型
使用Python实现智能食品营养分析的深度学习模型
38 6
|
8天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品储存管理的深度学习模型
使用Python实现智能食品储存管理的深度学习模型
23 2
|
10天前
|
机器学习/深度学习 算法 PyTorch
用Python实现简单机器学习模型:以鸢尾花数据集为例
用Python实现简单机器学习模型:以鸢尾花数据集为例
29 1
|
13天前
|
机器学习/深度学习 供应链 安全
使用Python实现智能食品供应链管理的深度学习模型
使用Python实现智能食品供应链管理的深度学习模型
53 3
|
12天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品安全监测的深度学习模型
使用Python实现智能食品安全监测的深度学习模型
31 0