备案控制台

开发者社区问答正文

机器学习中变量选择的一般过程是什么？

已解决

机器学习中变量选择的一般过程是什么？

展开

收起

gxx1 2022-04-01 14:20:25 614 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

gxx2

推荐回答

首先是基于 IV 值进行一次初步筛选，之后进行聚类分析，也就是将不同特征进行聚类得到不同的簇；之后在进行相关性分析，也就是将在计算变量编码后判断变量之间的相关性，给定阈值进行变量剔除，同时还需要注意剔除时应在不同的簇中进行选择；下来，我们逐步回归变量选择，最后只有 Xgboost 模型变量进行重要性排序，得到最终的变量筛选结果。"

2022-04-01 14:21:16

赞同展开评论

问答分类：

机器学习/深度学习

问答标签：

人工智能平台 PAI变量机器学习平台 PAI变量

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

机器学习PAI建议_is_point_wise这个变量可否改到配置里？

108

0

0

AI Earth使用机器学习进行监督分类时，怎么使特征变量都保持同一个空间分辨率是10m呢？

153

1

0

机器学习算法中LDA对于单个输入变量包括哪些？

2031

1

0

机器学习算法中选择自变量最常见的方法是什么呢？

2131

1

0

机器学习算法中选择自变量的标准是什么呢？

2087

1

0

机器学习算法中因变量的特殊性质会对线性概率模型的估计带来哪些影响？

2169

1

0

机器学习算法中因变量为分类变量会出现哪些问题呀？

2295

1

0

机器学习算法中常见的分类变量包括哪些呢？它们之间有什么区别？

2266

1

0

机器学习算法中分类变量是什么呀？

2748

1

0

机器学习中，因变量超过两个时，应该如何让解决呢？

1521

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

构建AI智能体：七十、小树成林，聚沙成塔：随机森林与大模型的协同进化

【风光场景生成】基于改进ISODATA的负荷曲线聚类算法（Matlab代码实现）

【博士论文复现】【阻抗建模、验证扫频法】光伏并网逆变器扫频与稳定性分析(包含锁相环电流环)（Simulink仿真实现）

需求响应动态冰蓄冷系统与需求响应策略的优化研究（Matlab代码实现）

【Copula】考虑风光联合出力和相关性的Copula场景生成（Matlab代码实现）

还有其他疑问?