机器学习PAI使用 XGBoost + binary:logistic (逻辑回归二分类,输出概率) 的方式训练模型, 如何在 PAI 台上查看特征重要性?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云机器学习平台 PAI 上使用 XGBoost 的 binary:logistic
(逻辑回归二分类,输出概率)方式训练模型后,可以通过以下步骤查看特征重要性:
在使用 XGBoost 训练组件时,需要确保在参数配置中启用了特征重要性的输出功能。具体操作如下:
PAI 命令方式: 在提交 XGBoost 训练任务的 PAI 命令中,添加以下参数以指定输出特征重要性表:
-DoutputImportanceTableName="feature_importance_table"
其中,feature_importance_table
是您自定义的表名,用于存储特征重要性结果。
可视化方式: 如果通过 Designer 可视化界面配置 XGBoost 组件,可以在组件的参数设置中找到 输出特征重要性表 的选项,并填写对应的表名。
注意:确保输入数据格式正确,且特征列和标签列已正确指定。
完成参数配置后,提交并运行训练任务。训练完成后,系统会自动将特征重要性结果写入您指定的表中。
训练任务完成后,可以通过以下方式查看特征重要性表的内容:
SELECT * FROM feature_importance_table;
查询结果通常包含以下字段: - feature:特征名称。 - importance:特征的重要性得分。 - rank:特征按重要性排序的排名。
特征重要性表中的得分可以帮助您理解哪些特征对模型预测的影响最大。通常,得分越高,特征对模型的贡献越大。您可以根据这些信息进行特征选择或优化模型。
outputImportanceTableName
参数,则无法生成特征重要性表。通过以上步骤,您可以在 PAI 平台上成功查看 XGBoost 模型的特征重要性,并利用这些信息优化模型性能。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。