一、fit、transform、fit_transform的区别和联系?
1、fit(): fit的作用就是求得训练集的均值、方差、最大值、最小值等。
2、transform(): transform的作用是在fit的基础上,进行标准化,降维,归一化等操作。
3、fit_transform(): 是fit和transform的结合,既包括了训练又包含了转换。
二、注意事项
1、注意,整个过程中只能fit一次,因为fit之后求得一套指标:均值、方差、最大最小值等。这套指标不仅用在训练集上,也用在测试集上,保证train、test的处理方式相同。
2、举例:
x_train = dict.fit_transform(x_train.to_dict(orient="records")) x_test = dict.transform(x_test.to_dict(orient="records"))
参考文章: