sklearn:sklearn.preprocessing中的Standardization、Scaling、 Normalization简介、使用方法之详细攻略

简介: sklearn:sklearn.preprocessing中的Standardization、Scaling、 Normalization简介、使用方法之详细攻略

目录

Standardization&Scaling、 Normalization简介

1、Standardization, or mean removal and variance scaling

1.1、Scaling features to a range

1.2、Scaling sparse data

1.3、Scaling data with outliers

1.4、Scaling vs Whitening

1.5、Centering kernel matrices

2、Normalization

Standardization&Scaling、 Normalization简介

参考文章:https://scikit-learn.org/stable/modules/preprocessing.html

image.png

1、Standardization, or mean removal and variance scaling 标准化,或均值去除和方差标度

image.png

from sklearn import preprocessing
import numpy as np
X_train = np.array([[ 1., -1.,  2.],
                    [ 2.,  0.,  0.],
                    [ 0.,  1., -1.]])
X_scaled = preprocessing.scale(X_train)
print(X_scaled )
Scaled data has zero mean and unit variance:
X_scaled.mean(axis=0)
X_scaled.std(axis=0)

image.png

scaler = preprocessing.StandardScaler().fit(X_train)
print(scaler)
print(scaler.mean_)
print(scaler.scale_)
print(scaler.transform(X_train))
X_test = [[-1., 1., 0.]]
scaler.transform(X_test)

1.1、Scaling features to a range  缩放功能到一个范围

image.png

1.2、Scaling sparse data  缩放稀疏数据

image.png

1.3、Scaling data with outliers 用离群值对数据进行缩放

image.png

1.4、Scaling vs Whitening 缩放比例与白化

image.png

1.5、Centering kernel matrices  中心核矩阵

image.png

2、Normalization  归一化

image.png

X = [[ 1., -1.,  2.],
     [ 2.,  0.,  0.],
     [ 0.,  1., -1.]]
X_normalized = preprocessing.normalize(X, norm='l2')
print(X_normalized)
normalizer = preprocessing.Normalizer().fit(X)  # fit does nothing
print(normalizer)
normalizer.transform(X)
normalizer.transform([[-1.,  1., 0.]])

image.png



相关文章
|
机器学习/深度学习 计算机视觉
sklearn 中 learning_curve 函数 的详细使用方法 (机器学习)
sklearn 中 learning_curve 函数 的详细使用方法 (机器学习)
246 0
sklearn 中 learning_curve 函数 的详细使用方法 (机器学习)
|
机器学习/深度学习 数据可视化 数据挖掘
PyTorch Geometric (PyG) 入门教程
PyTorch Geometric是PyTorch1的几何图形学深度学习扩展库。本文旨在通过介绍PyTorch Geometric(PyG)中常用的方法等内容,为新手提供一个PyG的入门教程。
PyTorch Geometric (PyG) 入门教程
|
存储 并行计算 PyTorch
基于Pytorch中安装torch_geometric简单详细完整版
基于Pytorch中安装torch_geometric简单详细完整版
855 0
基于Pytorch中安装torch_geometric简单详细完整版
|
数据可视化 Python
sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略
sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略
|
存储 计算机视觉 索引
sklearn:sklearn.GridSearchCV函数的简介、使用方法之详细攻略
sklearn:sklearn.GridSearchCV函数的简介、使用方法之详细攻略
|
机器学习/深度学习 存储 算法
sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略
sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略
|
机器学习/深度学习 数据挖掘 索引
ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略
ML之sklearn:sklearn.metrics中常用的函数参数(比如confusion_matrix等 )解释及其用法说明之详细攻略
|
计算机视觉 索引 Python
ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解
ML之sklearn:sklearn库中的ShuffleSplit()函数和StratifiedShuffleSplit()函数的讲解
Python之sklearn-pmml:sklearn-pmml的简介、安装、使用方法之详细攻略
Python之sklearn-pmml:sklearn-pmml的简介、安装、使用方法之详细攻略
Python之sklearn-pmml:sklearn-pmml的简介、安装、使用方法之详细攻略