EL之GB(GBC):利用GB对二分类问题进行建模并评估

简介: EL之GB(GBC):利用GB对二分类问题进行建模并评估

输出结果

T1、纯GB算法

image.png

image.png

image.png

image.png

T2、以RF为基学习器的GB算法

image.png

image.png

image.png


设计思路

image.png


核心代码

# nEst = 2000

# depth = 3

# learnRate = 0.007

# maxFeatures = None

nEst = 2000

depth = 3

learnRate = 0.007

maxFeatures = 20

rockVMinesGBMModel = ensemble.GradientBoostingClassifier(n_estimators=nEst, max_depth=depth,

                                                        learning_rate=learnRate,

                                                        max_features=maxFeatures)

rockVMinesGBMModel.fit(xTrain, yTrain)

auc = []

aucBest = 0.0

predictions = rockVMinesGBMModel.staged_decision_function(xTest)

for p in predictions:

   aucCalc = roc_auc_score(yTest, p)

   auc.append(aucCalc)

   if aucCalc > aucBest:

       aucBest = aucCalc

       pBest = p


相关文章
|
机器学习/深度学习 算法 数据可视化
JAMA | 机器学习中的可解释性:SHAP分析图像复刻与解读
JAMA | 机器学习中的可解释性:SHAP分析图像复刻与解读
2929 1
|
SQL 存储 数据库
OceanBase数据库常见问题之4.2.2写库过程中总是出现transaction is killed如何解决
OceanBase 是一款由阿里巴巴集团研发的企业级分布式关系型数据库,它具有高可用、高性能、可水平扩展等特点。以下是OceanBase 数据库使用过程中可能遇到的一些常见问题及其解答的汇总,以帮助用户更好地理解和使用这款数据库产品。
|
3月前
|
数据采集 存储 关系型数据库
全量抓取还是增量采集?二手房数据采集实战解析
本文以链家二手房数据采集为例,探讨全量抓取与增量采集的优劣与适用场景,并结合代理IP技术实现高效、稳定的爬虫方案。通过SQLite/PostgreSQL存储、内容哈希去重、定时任务调度等手段,构建可持续运行的数据更新与统计系统。适用于房产数据分析、市场监测等场景,兼顾资源效率与数据质量。
240 0
全量抓取还是增量采集?二手房数据采集实战解析
|
数据采集 机器学习/深度学习 Python
【Python】已完美解决:ImportError: cannot import name ‘Imputer‘ from ‘sklearn.preprocessing
【Python】已完美解决:ImportError: cannot import name ‘Imputer‘ from ‘sklearn.preprocessing
1118 3
|
NoSQL Java 中间件
springboot整合常用中间件框架案例
该项目是Spring Boot集成整合案例,涵盖多种中间件的使用示例,每个案例项目使用最小依赖,便于直接应用到自己的项目中。包括MyBatis、Redis、MongoDB、MQ、ES等的整合示例。
452 1
|
机器学习/深度学习 人工智能 大数据
阿里云大数据&AI 2022案例合集
阿里云2022大数据&AI精选产品案例合集,了解产品最新及最佳实践,助力企业实现降本增效。
阿里云大数据&AI 2022案例合集
|
JavaScript 前端开发 Unix
介绍一下Gulp的优缺点
【10月更文挑战第13天】介绍一下Gulp的优缺点
193 0
|
存储 缓存 安全
在Linux中,什么是软件仓库,并且如何管理它?
在Linux中,什么是软件仓库,并且如何管理它?
|
Python 数据挖掘 数据可视化
Python数据分析——Pandas与Jupyter Notebook
【6月更文挑战第1天】 本文探讨了如何使用Python的Pandas库和Jupyter Notebook进行数据分析。首先,介绍了安装和设置步骤,然后展示了如何使用Pandas的DataFrame进行数据加载、清洗和基本分析。接着,通过Jupyter Notebook的交互式环境,演示了数据分析和可视化,包括直方图的创建。文章还涉及数据清洗,如处理缺失值,并展示了如何进行高级数据分析,如数据分组和聚合。此外,还提供了将分析结果导出到文件的方法。通过销售数据的完整案例,详细说明了从加载数据到可视化和结果导出的全过程。最后,讨论了进一步的分析和可视化技巧,如销售额趋势、产品销售排名和区域分布,以及