Sklearn库中的决策树模型主要有以下参数:
- criterion:特征选择的标准,可选值有"gini"和"entropy"。默认为"gini"。
- splitter:特征划分点选择标准,可选值有"best"和"random"。默认为"best"。
- max_depth:决策树的最大深度,如果为None,则表示节点的扩展直至所有叶节点都是纯净的,或者所有叶子节点包含的样本数小于min_samples_split。
- min_samples_split:内部节点再划分所需最小样本数。
- min_samples_leaf:叶子节点最少样本数。
- max_features:寻找最优划分时考虑的特征数量,可选值有"auto", "sqrt", "log2", None或整数。默认为"auto"。
- random_state:随机数种子。
- max_leaf_nodes:最大叶子节点数。
- min_impurity_decrease:如果节点划分后不纯度减少量小于这个值,那么这个节点不再进行划分。