多年来,数据科学领域的许多趋势已经发生了改变。Kaggle,作为全球最大、最受欢迎的数据科学社区,记录着这些变化的演进状态。本文将使用 Kaggle Meta Data 逐一分析,看看这些年来,我们的数据科学究竟发生了什么变化?
线性回归与逻辑回归
线性回归与逻辑回归是机器学习中比较基础又很常用的...
1. The Problem of Overfitting
1
还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。
如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说...