模型参数
参数名 | 参数描述 | 可选值 |
boosting_type | 模型提升方式 | ‘gbdt’、‘dart’、‘goss’、‘rf’ |
num_leaves | 每个基学习器的最大叶子 | 默认31 |
max_depth | 基学习器树的最大深度 | 默认-1,没有限制 |
learning_rate | boosting学习率 | 默认0.1 |
n_estimators | 基学习器的数量 | 默认10 |
max_bin | 特征值的分桶数 | 默认255 |
subsample_for_bin | 用于分箱的样本数 | 默认50000 |
objective | 学习任务和学习目标 | 默认regression对于LGBRegressor,LGBClassifier是’binary’,‘multiclass’,LGBMRanker是’lambdarank’ |
min_split_gain | 在树的叶子节点上做进一步分区所需的最小损失减少 | 默认0,浮点数 |
min_child_weight | 子节点(叶节点)中所需要的最小实例权重(hessian)之和 | 默认1e-3 |
min_child_samples | 叶子所需要的最小数据 | 默认20 |
subsample | 训练样本的子样本比率 | 默认1,浮点数 |
subsample_freq | 子样本的频率 | 默认1,int |
colsample_bytree | 构造每棵树的子样本比率 | 默认1,浮点数 |
reg_alpha | L1正则化权重 | 默认0,浮点数 |
reg_lambda | L2正则化权重 | 默认0,浮点数 |
random_state | 随机数种子 | 默认为None |
n_jobs | 并行线程数 | 默认为-1,全线程 |
slient | 在运行提升时,是否打印消息 | 默认为True |
fit参数
参数 | 参数描述 | 可选值 |
X | 输入特征矩阵 | n_samples,n_features |
y | 标签 | n_samples |
sample_weight | 训练数据的权重 | 默认None |
init_score | 初始化训练数据得分 | 默认None |
group | 训练集的分组数据 | 默认None |
eval_set | 用作提前停止的验证集的(X, y) | 默认None |
eval_names | eval_set的名字 | 默认None |
eval_sample_weight | 验证集数据的权重 | 默认None |
eval_init_score | 验证集数据初始分数 | 默认None |
eval_group | 验证集的分组数据 | 默认None |
eval_metric | 字符串,它应该是一个内置的评估指标。如果是可调用的,它应该是一个定制的评估指标,请参阅注释以了解更多细节 | 默认None |
early_stopping_rounds | 激活早期停止。该模型将进行训练,直到验证分数停止改进。为了继续训练,验证错误需要至少每轮减少一次 | 默认None |
verbose | 如果为True并且使用了评估集,则写入评估进度 | 默认True |
feature_name | 特征名称,如果’ auto '和data是 DataFrame,则使用数据列名称 | 默认auto |
categorical_feature | 分类功能,如果是int的列表,则解释为下标。如果字符串列表,解释为特性名称(也需要指定feature_name),如果’ auto '和data是pandas DataFrame,则使用pandas分类列 | 默认auto |
callbacks | 在每次迭代中应用的回调函数列表 | 默认None |
predict参数
参数 | 参数描述 | 可选值 |
X | 输入特征矩阵 | n_samples,n_features |
raw_score | 是否预测原始分数 | 默认False |
num_iter_action | 预测中限制迭代次数;默认为0(使用所有树) | 默认0 |
n_features_
得到拟合模型的特征个数
objective_
获得模型拟合的具体目标
classes_
返回标签的所有分类(仅限于分类问题)
n_classes_
返回标签的类别数量
best_score_
返回模型的最好分数
best_iteration
指定了early_stopping_rounds时拟合模型的最佳迭代
booster_
模型的提升方式
evals_result
如果已指定early_stopping_rounds,则计算结果
feature_importances_
返回每个特征的特征重要性