#主成分分析 降维 import pandas as pd #参数初始化 inputfile = 'C:/Users/Administrator/Desktop/rb000.xlsx' data = pd.read_excel(inputfile) #读入数据 data=data.dropna() data=data.loc[1:,::] data.columns=list(range(len(data.columns))) from sklearn.decomposition import PCA pca = PCA() pca.fit(data) pca.components_ #返回模型的各个特征向量 ratio=pca.explained_variance_ratio_ #返回各个成分各自的方差百分比 ratio[0]
计算各个技术指标之后,返回方差百分比,发现第一个维度占比0.99999962739146842,无限接近于1.
据悉,方差百分比,也称为贡献率,越大,代表着权重越大,代表着对于这些变量的解释度越高。那么,是不是可以理解,其实有一个指标可以代表这30多个指标呢?其实绝大部分指标用处并不大?