备案控制台

开发者社区人工智能文章正文

利用各类回归模型，对数据集进行建模

2024-08-08 60 发布于河南

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【8月更文挑战第8天】利用各类回归模型，对数据集进行建模。

利用各类回归模型，对数据集进行建模

模型的名字

names = ['LinerRegression',
'Ridge',
'Lasso',
'Random Forrest',
'GBDT',
'Support Vector Regression',
'ElasticNet',
'XgBoost']

定义模型

cv在这里是交叉验证的思想

models = [LinearRegression(),
RidgeCV(alphas=(0.001,0.1,1),cv=3),
LassoCV(alphas=(0.001,0.1,1),cv=5),
RandomForestRegressor(n_estimators=10),
GradientBoostingRegressor(n_estimators=30),
SVR(),
ElasticNet(alpha=0.001,max_iter=10000),
XGBRegressor()]

输出所有回归模型的R2评分

定义R2评分的函数

def R2(model,x_train, x_test, y_train, y_test):

model_fitted = model.fit(x_train,y_train)
y_pred = model_fitted.predict(x_test)
score = r2_score(y_test, y_pred)
return score

遍历所有模型进行评分

for name,model in zip(names,models):
score = R2(model,x_train, x_test, y_train, y_test)
print("{}: {:.6f}, {:.4f}".format(name,score.mean(),score.std()))

输出：
LinerRegression: 0.564144, 0.0000
Ridge: 0.563700, 0.0000
Lasso: 0.564078, 0.0000
Random Forrest: 0.646657, 0.0000
GBDT: 0.725883, 0.0000
Support Vector Regression: 0.517310, 0.0000
ElasticNet: 0.564021, 0.0000
XgBoost: 0.765266, 0.0000

文章标签：

计算机视觉

龙腾九州

+关注

1276文章 614问答

目录

打赏

0

4

4

0

342

相关文章

Deephub

|

5月前

|

机器学习/深度学习数据采集数据挖掘

特征工程在营销组合建模中的应用：基于因果推断的机器学习方法优化渠道效应估计

因果推断方法为特征工程提供了一个更深层次的框架，使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要，如经济学、医学和市场营销。

Deephub

162 1 2

特征工程在营销组合建模中的应用：基于因果推断的机器学习方法优化渠道效应估计

zzy的aly

|

5月前

|

数据采集移动开发数据可视化

模型预测笔记(一)：数据清洗分析及可视化、模型搭建、模型训练和预测代码一体化和对应结果展示(可作为baseline)

这篇文章介绍了数据清洗、分析、可视化、模型搭建、训练和预测的全过程，包括缺失值处理、异常值处理、特征选择、数据归一化等关键步骤，并展示了模型融合技术。

zzy的aly

563 1 2

模型预测笔记(一)：数据清洗分析及可视化、模型搭建、模型训练和预测代码一体化和对应结果展示(可作为baseline)

源码星辰

|

5月前

|

机器学习/深度学习算法数据可视化

机器学习的核心功能：分类、回归、聚类与降维

机器学习领域的基本功能类型通常按照学习模式、预测目标和算法适用性来分类。这些类型包括监督学习、无监督学习、半监督学习和强化学习。

源码星辰

118 0 0

东方睿赢

|

9月前

|

机器学习/深度学习分布式计算算法

在机器学习项目中，选择算法涉及问题类型识别（如回归、分类、聚类、强化学习）

【6月更文挑战第28天】在机器学习项目中，选择算法涉及问题类型识别（如回归、分类、聚类、强化学习）、数据规模与特性（大数据可能适合分布式算法或深度学习）、性能需求（准确性、速度、可解释性）、资源限制（计算与内存）、领域知识应用以及实验验证（交叉验证、模型比较）。迭代过程包括数据探索、模型构建、评估和优化，结合业务需求进行决策。

东方睿赢

78 0 0

richard_yuu

|

9月前

|

机器学习/深度学习算法数据可视化

【机器学习】分类与预测算法的评价与优化

【机器学习】分类与预测算法的评价与优化

richard_yuu

132 0 0

请看我回答~

|

10月前

|

机器学习/深度学习数据采集自然语言处理

探索机器学习中的维度诅咒与特征工程

【4月更文挑战第26天】在高维数据空间航行，机器学习模型常受维度诅咒之困扰，遭遇过拟合、计算成本增加和解释性下降等问题。本文通过深入分析维度诅咒的成因，探讨了特征工程作为解决之道的关键策略，包括特征选择、特征提取及特征转换等技术。我们将透过实例说明如何巧妙运用这些方法，以降低数据维度，提升模型性能，同时保持结果的可解释性。

请看我回答~

102 4 4

拓端数据部落

|

10月前

|

数据可视化

R语言KNN模型分类信贷用户信用等级数据参数调优和预测可视化|数据分享

R语言KNN模型分类信贷用户信用等级数据参数调优和预测可视化|数据分享

拓端数据部落

104 0 0

豌豆射手^

|

10月前

|

机器学习/深度学习数据采集数据可视化

【机器学习】样本、特征、标签：构建智能模型的三大基石

【机器学习】样本、特征、标签：构建智能模型的三大基石

豌豆射手^

3702 0 0

汀丶人工智能

|

自然语言处理数据处理 API

零样本文本分类应用：基于UTC的医疗意图多分类，打通数据标注-模型训练-模型调优-预测部署全流程。

零样本文本分类应用：基于UTC的医疗意图多分类，打通数据标注-模型训练-模型调优-预测部署全流程。

汀丶人工智能

913 0 1

壹佰、

|

机器学习/深度学习算法数据挖掘

机器学习：聚类算法与无监督学习、模型评估标准

机器学习：聚类算法与无监督学习、模型评估标准

壹佰、

592 0 0

机器学习：聚类算法与无监督学习、模型评估标准

热门文章

最新文章

阿里云SSL证书价格从免费到收费详细收费价格表

物联网平台场景体验小记

【转载】ZOL天下IT:摩卡北塔抄袭门（243期）

js时钟（秒）

Android -- MeasureSpec

Struts2.5使用通配符的方式实现动态方法调用报错

poj 2562 Primary Arithmetic

HTML5网站大观：15个精美的 HTML5 单页网站作品欣赏

网站性能优化之应用程序缓存-初篇

[IDA] 分析for循环的汇编代码

如何精准做到合同到期后不再发生业务？还是邻家系统做得真好！

清华大学104页PPT《DeepSeek从入门到精通》分享

【01】Cocos游戏开发引擎从0开发一款游戏-cocos环境搭建以及配置-Cocos Creator软件系统下载安装-node环境-优雅草卓伊凡

对话｜企业如何构建更完善的容器供应链安全防护体系

Redis应用—1.在用户数据里的应用

云数据库实战：基于阿里云RDS的Python应用开发与优化

云数据库：从零到一，构建高可用MySQL集群

2025年阿里云用户安全体检通知：免费权益，一键开启

基于MPPT最大功率跟踪的离网光伏发电系统Simulink建模与仿真

DeepSeek 满血版在 IDEA 中怎么用？手把手教程来了

相关课程

更多

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

机器学习基础与回归算法

机器学习集成学习与模型融合

机器学习概览及常见算法

神经网络概览及算法详解

特征工程简介

相关电子书

更多

纯干货|机器学习中梯度下降法的分类及对比分析

纯干货 | 机器学习中梯度下降法的分类及对比分析

弱监督机器学习范式

相关实验场景

更多

如何快速训练大模型

推荐系统入门之使用ALS算法实现打分预测

基于函数计算实现AI推理

下一篇

通义万相：视觉生成大模型再进化

目录

目录