1、LR 的推导,特性?
Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 简单、可并行化、可解释强。Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。
逻辑回归 = 线性回归+sigmoid函数


2、决策树的特性?
不要求任何先验假设,不假定类和其他属性服从一定的概率分布。
效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
决策树相对容易解释,特别是小型的决策树
对缺失值不敏感
冗余属性不会对决策树的准确率造成不利的影响。一个属性如果在数据中它与另一个属性是强相关的,那么它是冗余的。在两个冗余的属性中,如果已经选择其中一个作为用于划分的属性,则另一个将被忽略。假设两个属性完全一样,那么当其中一个被选中作为划分属性时,那么划分过后的子女结点中包含的另一个属性应该是完全一样的。这时如果你想对子女结点用第二个属性划分时,将只有一个属性值。非上述极端情况下,增益也会很小,这样就不会被选中作为划分属性。