开发者社区> 问答> 正文

大家都有什么好的调参技巧

经常会遇到这样的情况:
比如用 随机森林模型,因为正负样本比例严重失衡,往往对负样本进行抽样。
如果抽样5%的话,每次程序执行结果 漂移很严重。比如这次跑出6%,下次可能跑出7%
在这种情况下,应该如何在线下跑出一个模型用来预测线上的结果?



展开
收起
bigdata 2014-04-05 16:40:03 7646 0
2 条回答
写回答
取消 提交回答
  • Re大家都有什么好的调参技巧
    负样本再抽样 样本就太少了
    可以看看SMOTE这种抽样
    评价的话 直接用F1 不要再看准确率了
    还有,我记得rf也可以输出概率的话,可以多试试几个cutoff,不一定是0.5的地方。
    这个加入了时间因素,貌似没法做cv,慢慢调吧

    -------------------------

    Re大家都有什么好的调参技巧
    == 貌似说错了, 用时间惩罚后的分类样本,可以做CV,就是数据少了点
    2014-04-06 01:18:45
    赞同 展开评论 打赏
  • Re大家都有什么好的调参技巧
    LR的那个阈值判别参数目前都还不会调
    2014-04-05 22:12:43
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
理解过拟合 立即下载
展心展力MetaApp:基于DeepRec的稀疏模型训练实践 立即下载
纯干货 | 机器学习中梯度下降法的分类及对比分析 立即下载