常见问题是没有设置对样本和特征的采样率。
对样本的采样率:一般采样之后有10到20万样本即可,例如100万训练样本,设置0.1的样本采样率。
对特征的采样率:例如1000个特征,设置0.2的采样率,树最多200个特征,树的数量同样也要设置多一些;如果100个特征,则可以设置0.8 的采样率,每次针对80个特征建树。
常见问题是没有设置对样本和特征的采样率。
对样本的采样率:一般采样之后有10到20万样本即可,例如100万训练样本,设置0.1的样本采样率。
对特征的采样率:例如1000个特征,设置0.2的采样率,树最多200个特征,树的数量同样也要设置多一些;如果100个特征,则可以设置0.8 的采样率,每次针对80个特征建树。