决策树是一种树状结构,它的每一个叶节点对应一个分类,非叶节点对应在某个属性上的划分,根据样本在该属性上的不同取值将其划分为若干子集。构造决策树的核心问题是在每一步如何选择适当的属性对样本进行划分。
ID3算法
1、对当前样本集合计算所有属性的信息增益。
2、选择信息增益最大的属性作为测试属性,把测试属性取值相同的样本划为同一个子样本集。
3、若子样本集的类别属性只含有单个属性,则分支为叶子节点,判断其属性值并标上相应的符号,然后返回调用处;否则对子样本集递归调用算法。
决策树是一种树状结构,它的每一个叶节点对应一个分类,非叶节点对应在某个属性上的划分,根据样本在该属性上的不同取值将其划分为若干子集。构造决策树的核心问题是在每一步如何选择适当的属性对样本进行划分。
ID3算法
1、对当前样本集合计算所有属性的信息增益。
2、选择信息增益最大的属性作为测试属性,把测试属性取值相同的样本划为同一个子样本集。
3、若子样本集的类别属性只含有单个属性,则分支为叶子节点,判断其属性值并标上相应的符号,然后返回调用处;否则对子样本集递归调用算法。