Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例

本文涉及的产品
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例

回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。它与正向逐步回归有关。在这种方法中,在每个步骤中选择最相关的变量,其方向在两个预测因子之间是等角的。  

在本教程中,我们将学习如何用Python中的LARS和Lasso Lars算法拟合回归数据。我们将在本教程中估计住房数据集。这篇文章包括

  1. 准备数据
  2. 如何使用LARS
  3. 如何使用Lasso LARS

让我们从加载所需的包开始。

from sklearn import linear_model

准备数据

我们将加载波士顿的数据集,并将其分成训练和测试两部分。

boston = load_boston()
xtrain, xtest, ytrain, ytest=train\_test\_split(x, y, test_size=0.15)

如何使用LARS

我们将用Lars()类定义模型(有默认参数),并用训练数据来拟合它。

Lars().fit(xtrain, ytrain)

并检查模型的系数。

print(lars.coef_)
\[-1.16800795e-01  1.02016954e-02 -2.99472206e-01  4.21380667e+00
 -2.18450214e+01  4.01430635e+00 -9.90351759e-03 -1.60916999e+00
 -2.32195752e-01  2.80140313e-02 -1.08077980e+00  1.07377184e-02
 -5.02331702e-01\]

接下来,我们将预测测试数据并检查MSE和RMSE指标。

mean\_squared\_error(ytest, ypred)
print("MSE: %.2f" % mse)
MSE: 36.96
print("RMSE: %.2f" % sqrt(mse))
RMSE: 6.08

最后,我们将创建绘图,使原始数据和预测数据可视化。

plt.show()

如何使用Lasso Lars

LassoLars是LARS算法与Lasso模型的一个实现。我们将用LassoLars()类定义模型,将α参数设置为0.1,并在训练数据上拟合模型。

LassoLars(alpha =.1).fit(xtrain, ytrain)

我们可以检查系数。

print(coef_)
\[ 0.          0.          0.          0.          0.          3.00873485
  0.          0.          0.          0.         -0.28423008  0.
 -0.42849354\]

接下来,我们将预测测试数据并检查MSE和RMSE指标。

predict(xtest)
print("MSE: %.2f" % mse)
MSE: 45.59
print("RMSE: %.2f" % sqrt(mse))
RMSE: 6.75

最后,我们将创建绘图,使原始数据和预测数据可视化。

plt.show()

在本教程中,我们已经简单了解了如何用LARS和Lasso Lars算法来拟合和预测回归数据。

参考文献

  1. Least Angle Regression, by Efron Bradley; Hastie Trevor; Johnstone Iain; Tibshirani Robert (2004)
  2. Least-Angel Regression, Wikipedia

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
2天前
|
计算机视觉 Windows Python
windows下使用python + opencv读取含有中文路径的图片 和 把图片数据保存到含有中文的路径下
在Windows系统中,直接使用`cv2.imread()`和`cv2.imwrite()`处理含中文路径的图像文件时会遇到问题。读取时会返回空数据,保存时则无法正确保存至目标目录。为解决这些问题,可以使用`cv2.imdecode()`结合`np.fromfile()`来读取图像,并使用`cv2.imencode()`结合`tofile()`方法来保存图像至含中文的路径。这种方法有效避免了路径编码问题,确保图像处理流程顺畅进行。
19 1
|
2天前
|
算法 Python
Python 中的数据抽象
【8月更文挑战第29天】
20 11
|
2天前
|
JSON 数据格式 Python
Python快速获取国内最新放假安排数据
Python快速获取国内最新放假安排数据
|
2天前
|
存储 数据可视化 Python
使用python moviepy提取视频中的音频,同时对音频数据进行数据可视化分析
使用python moviepy提取视频中的音频,同时对音频数据进行数据可视化分析
6 0
|
2天前
|
索引 Python
python pandas 把数据保存成csv文件,以及读取csv文件获取指定行、指定列数据
该文档详细介绍了如何使用Python的Pandas库处理图像数据集,并将其保存为CSV文件。示例数据集位于`test_data`目录中,包含5张PNG图片,每张图片名中的数字代表其标签。文档提供了将这些数据转换为CSV格式的具体步骤,包括不同格式的数据输入方法(如NumPy数组、嵌套列表、嵌套元组和字典),以及如何使用`pd.DataFrame`和`to_csv`方法保存数据。此外,还展示了如何读取CSV文件并访问其中的每一行和每一列数据,包括获取列名、指定列数据及行数据的操作方法。
9 1
|
18天前
|
算法
基于模糊控制算法的倒立摆控制系统matlab仿真
本项目构建了一个基于模糊控制算法的倒立摆控制系统,利用MATLAB 2022a实现了从不稳定到稳定状态的转变,并输出了相应的动画和收敛过程。模糊控制器通过对小车位置与摆的角度误差及其变化量进行模糊化处理,依据预设的模糊规则库进行模糊推理并最终去模糊化为精确的控制量,成功地使倒立摆维持在直立位置。该方法无需精确数学模型,适用于处理系统的非线性和不确定性。
基于模糊控制算法的倒立摆控制系统matlab仿真
|
13天前
|
算法 数据安全/隐私保护
基于LS算法的OFDM+QPSK系统信道估计均衡matlab性能仿真
基于MATLAB 2022a的仿真展示了OFDM+QPSK系统中最小二乘(LS)算法的信道估计与均衡效果。OFDM利用多个低速率子载波提高频谱效率,通过循环前缀克服多径衰落。LS算法依据导频符号估计信道参数,进而设计均衡器以恢复数据符号。核心程序实现了OFDM信号处理流程,包括加性高斯白噪声的加入、保护间隔去除、快速傅立叶变换及信道估计与均衡等步骤,并最终计算误码率,验证了算法的有效性。
31 2
|
12天前
|
算法
基于GA-PSO遗传粒子群混合优化算法的CVRP问题求解matlab仿真
本文介绍了一种基于GA-PSO混合优化算法求解带容量限制的车辆路径问题(CVRP)的方法。在MATLAB2022a环境下运行,通过遗传算法的全局搜索与粒子群算法的局部优化能力互补,高效寻找最优解。程序采用自然数编码策略,通过选择、交叉、变异操作及粒子速度和位置更新,不断迭代直至满足终止条件,旨在最小化总行驶距离的同时满足客户需求和车辆载重限制。
|
17天前
|
机器学习/深度学习 算法 定位技术
MATLAB - 遗传算法(GA)求解旅行商问题(TSP)
MATLAB - 遗传算法(GA)求解旅行商问题(TSP)
28 3
|
18天前
|
算法
基于多路径路由的全局感知网络流量分配优化算法matlab仿真
本文提出一种全局感知网络流量分配优化算法,针对现代网络中多路径路由的需求,旨在均衡分配流量、减轻拥塞并提升吞吐量。算法基于网络模型G(N, M),包含N节点与M连接,并考虑K种不同优先级的流量。通过迭代调整每种流量在各路径上的分配比例,依据带宽利用率um=Σ(xm,k * dk) / cm来优化网络性能,确保高优先级流量的有效传输同时最大化利用网络资源。算法设定收敛条件以避免陷入局部最优解。

热门文章

最新文章

下一篇
云函数