ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

简介: ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)


目录

利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

1、数据集基本信息

2、模型结果输出


 

 

相关文章

ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

ML之回归预测:利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)实现

利用Lasso、ElasticNet、GBDT等算法构建集成学习算法AvgModelsR对国内某平台上海2020年6月份房价数据集【12+1】进行回归预测(模型评估、模型推理)

1、数据集基本信息

1.  (3000, 13) 13 3000
2. 
3.  total_price         object
4. unit_price          object
5. roomtype            object
6. height              object
7. direction           object
8. decorate            object
9. area                object
10. age                float64
11. garden              object
12. district            object
13. total_price_Num    float64
14. unit_price_Num       int64
15. area_Num           float64
16. dtype: object
17. 
18.  Index(['total_price', 'unit_price', 'roomtype', 'height', 'direction',
19. 'decorate', 'area', 'age', 'garden', 'district', 'total_price_Num',
20. 'unit_price_Num', 'area_Num'],
21.       dtype='object')
22. 
23.    total_price unit_price roomtype  ... total_price_Num unit_price_Num area_Num
24. 0        290万  46186元/平米     2室1厅  ...           290.0          46186    62.79
25. 1        599万  76924元/平米     2室1厅  ...           599.0          76924    77.87
26. 2        420万  51458元/平米     2室1厅  ...           420.0          51458    81.62
27. 3      269.9万  34831元/平米     2室2厅  ...           269.9          34831    77.49
28. 4        383万  79051元/平米     1室1厅  ...           383.0          79051    48.45
29. 
30. [5 rows x 13 columns]
31. 
32.       total_price unit_price roomtype  ... total_price_Num unit_price_Num area_Num
33. 2995        230万  43144元/平米     1室1厅  ...           230.0          43144    53.31
34. 2996        372万  75016元/平米     1室1厅  ...           372.0          75016    49.59
35. 2997        366万  49973元/平米     2室1厅  ...           366.0          49973    73.24
36. 2998        365万  69103元/平米     2室1厅  ...           365.0          69103    52.82
37. 2999        420万  49412元/平米     2室2厅  ...           420.0          49412    85.00
38. 
39. [5 rows x 13 columns]
40. <class 'pandas.core.frame.DataFrame'>
41. RangeIndex: 3000 entries, 0 to 2999
42. Data columns (total 13 columns):
43. #   Column           Non-Null Count  Dtype  
44. ---  ------           --------------  -----  
45. 0   total_price      3000 non-null   object
46. 1   unit_price       3000 non-null   object
47. 2   roomtype         3000 non-null   object
48. 3   height           3000 non-null   object
49. 4   direction        3000 non-null   object
50. 5   decorate         3000 non-null   object
51. 6   area             3000 non-null   object
52. 7   age              2888 non-null   float64
53. 8   garden           3000 non-null   object
54. 9   district         3000 non-null   object
55. 10  total_price_Num  3000 non-null   float64
56. 11  unit_price_Num   3000 non-null   int64  
57. 12  area_Num         3000 non-null   float64
58. dtypes: float64(3), int64(1), object(9)
59. memory usage: 304.8+ KB
60. 
61.                 age  total_price_Num  unit_price_Num     area_Num
62. count  2888.000000      3000.000000     3000.000000  3000.000000
63. mean   2001.453601       631.953450    58939.028333   102.180667
64. std       9.112425       631.308855    25867.208297    62.211662
65. min    1911.000000        90.000000    11443.000000    17.050000
66. 25%    1996.000000       300.000000    40267.500000    67.285000
67. 50%    2003.000000       437.000000    54946.000000    89.230000
68. 75%    2008.000000       738.000000    73681.250000   119.035000
69. max    2018.000000      9800.000000   250813.000000   801.140000

 

 

2、模型结果输出

1. AvgModelsR(models=(Pipeline(steps=[('robustscaler', RobustScaler()),
2.                                    ('lasso',
3.                                     Lasso(alpha=0.001, random_state=1))]),
4.                    Pipeline(steps=[('robustscaler', RobustScaler()),
5.                                    ('elasticnet',
6.                                     ElasticNet(alpha=0.001, l1_ratio=0.9,
7.                                                random_state=3))]),
8.                    GradientBoostingRegressor(random_state=5)))
9. R2_res [0.9944881811696309, 0.000626615309319283, array([0.99470591, 0.99512495, 0.99435729, 0.99491104, 0.99334171])]
10. MAE_res [-0.004994183753322101, 0.0001083601234287803, array([-0.00493338, -0.005202  , -0.00489054, -0.00498097, -0.00496404])]
11. RMSE_res [-8.323227156546791e-05, 9.870911328329942e-06, array([-8.14778066e-05, -7.79621763e-05, -7.93078692e-05, -7.49049128e-05,
12.        -1.02508593e-04])]
13. AvgModelsR(models=(Pipeline(steps=[('robustscaler', RobustScaler()),
14.                                    ('lasso',
15.                                     Lasso(alpha=0.001, random_state=1))]),
16.                    Pipeline(steps=[('robustscaler', RobustScaler()),
17.                                    ('elasticnet',
18.                                     ElasticNet(alpha=0.001, l1_ratio=0.9,
19.                                                random_state=3))]),
20.                    GradientBoostingRegressor(random_state=5)))
21. Avg_Best_models Score value: 0.9947618159336031
22. Avg_Best_models R2    value: 0.9947618159336031
23. Avg_Best_models MAE   value: 0.0064209273962331555
24. Avg_Best_models MSE   value: 9.023779248949011e-05
25. 
26. Avg_Best_models模型花费时间: 0:06:14.344069

 

相关文章
|
10月前
|
机器学习/深度学习 算法 数据挖掘
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
274 0
|
9月前
|
机器学习/深度学习 运维 算法
【微电网多目标优化调度】多目标学习者行为优化算法MOLPB求解微电网多目标优化调度研究(Matlab代码实现)
【微电网多目标优化调度】多目标学习者行为优化算法MOLPB求解微电网多目标优化调度研究(Matlab代码实现)
361 1
|
8月前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
319 0
|
9月前
|
机器学习/深度学习 编解码 并行计算
【创新未发表!】基于BKA算法优化-BP、HO算法优化-BP、CP算法优化-BP、GOOSE算法优化-BP、NRBO算法优化-BP神经网络回归预测比较研究(Matlab代码)
【创新未发表!】基于BKA算法优化-BP、HO算法优化-BP、CP算法优化-BP、GOOSE算法优化-BP、NRBO算法优化-BP神经网络回归预测比较研究(Matlab代码)
515 0
|
算法 数据可视化 开发者
为什么要学习数据结构与算法
今天,我向大家介绍一门非常重要的课程——《数据结构与算法》。这门课不仅是计算机学科的核心,更是每一位开发者从“小白”迈向“高手”的必经之路。
为什么要学习数据结构与算法
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
机器学习/深度学习 数据采集 算法
基于PSO粒子群优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目展示了基于PSO优化的CNN-LSTM-SAM网络时间序列预测算法。使用Matlab2022a开发,完整代码含中文注释及操作视频。算法结合卷积层提取局部特征、LSTM处理长期依赖、自注意力机制捕捉全局特征,通过粒子群优化提升预测精度。适用于金融市场、气象预报等领域,提供高效准确的预测结果。
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目使用MATLAB 2022a实现时间序列预测算法,完整程序无水印。核心代码包含详细中文注释和操作视频。算法基于CNN-LSTM-SAM网络,融合卷积层、LSTM层与自注意力机制,适用于金融市场、气象预报等领域。通过数据归一化、种群初始化、适应度计算及参数优化等步骤,有效处理非线性时间序列,输出精准预测结果。
|
机器学习/深度学习 数据采集 算法
基于WOA鲸鱼优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本内容介绍了一种基于CNN-LSTM-SAM网络与鲸鱼优化算法(WOA)的时间序列预测方法。算法运行于Matlab2022a,完整程序无水印并附带中文注释及操作视频。核心流程包括数据归一化、种群初始化、适应度计算及参数更新,最终输出最优网络参数完成预测。CNN层提取局部特征,LSTM层捕捉长期依赖关系,自注意力机制聚焦全局特性,全连接层整合特征输出结果,适用于复杂非线性时间序列预测任务。

热门文章

最新文章