目录
特征工程处理中常用的数据变换(log取对数变换等)之详细攻略
特征工程处理中常用的数据变换(log取对数变换等)之详细攻略
log取对数变换
意义:取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定,消除异方差问题。
1. import numpy as np 2. import pandas as pd 3. 4. 5. array_data=np.array([[1, 2, 3, 4, 5], 6. [0.1,0.2,0.3,0.4,0.5]) 7. print(array_data.shape) 8. 9. 10. array_data2log = -np.log(array_data) # 取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度。让方差恒定,即让波动相对稳定。消除异方差问题 11. print(array_data2log) 12. dis = np.sqrt(array_data2log) 13. print(dis)
更新……