KPCA-小麦分类

简介: KPCA-小麦分类

import required packages

import numpy as np
import matplotlib.pyplot as plt
from sklearn import   datasets,decomposition

处理数据得到标准化后的X和y

fp=open('seeds_dataset.txt','r')
ls=[]
for line in fp:
    line=line.strip('\n')   #将\n去掉
    ls.append(line.split('\t'))   #将空格作为分隔符将一个字符切割成一个字符数组
fp.close()
ls=numpy.array(ls,dtype=float)   #将其转换成numpy的数组,并定义数据类型为float
print(ls)
# 将文件转为DataFrame表格
ls_pd = pd.DataFrame(ls)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
data_std = sc.fit_transform(ls_pd.loc[:,1:6])

plot_PCA函数

def plot_KPCA(*data):
#     ''' 绘制经过 KernelPCA 降维到二维之后的样本点'''
    X,y=data
    kernels=['linear','poly','rbf','sigmoid']
    fig=plt.figure(figsize = (10,10))
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 颜色集合,不同标记的样本染不同的颜色
    for i,kernel in enumerate(kernels): # 外层循环是对于kernel的循环 外层第一次循环,某一种kernel的三种类别被画出来了
        kpca=decomposition.KernelPCA(n_components=2,kernel=kernel)
        kpca.fit(X)
        X_r=kpca.transform(X)# 原始数据集转换到二维
        ax=fig.add_subplot(2,2,i+1) ## 两行两列,每个单元显示一种核函数的 KernelPCA 的效果图
        for label ,color in zip( np.unique(y),colors): # np.unique(y)得到几个类别:1、2、3
            position=y==label# position的长度为210
#             print(position) # 第一次所有类别为1的样本的Position为True
            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"%label,
            color=color) # 找到某一个label的x的列表集合 找到某一个label的y的列表集合
            # scatter函数的第一个参数是x的列表,第二个参数是y的列表     
#             break
#         break
#         ax.set_xlabel("X[0]")
#         ax.set_ylabel("X[1]")
#         ax.legend(loc="best")
#         ax.set_title("kernel=%s"%kernel)
#     plt.suptitle("KPCA")
    plt.show()

探索函数

kk = np.array([[1,2],
              [3,4],
              [5,6]])

kk

array([[1, 2],

[3, 4],

[5, 6]])

pp = pd.Series([True,True,False])

(kk[pp,0],kk[pp,1])

(array([1, 3]), array([2, 4]))

实验过程

  1. 首先处理数据后得到标准化后的data_std和样本标签y。
  2. 调用plot_KPCA函数画出不同kernel的KPCA分类图(特征降到二维后分类的图)

实验结果

相关文章
|
数据挖掘 定位技术
男性多项身体维度数据探索
男性多项身体维度数据探索
362 0
|
4月前
|
机器学习/深度学习 人工智能 芯片
牛津光计算论文登Nature正刊,分析帕金森患者步态准确率达92.2%
【9月更文挑战第23天】牛津大学研究人员在《自然》杂志上发表了一篇关于光计算的重要论文,展示了一种利用光的局部相干性增强光子计算并行性的新方法。该技术通过部分相干光与重建方法结合,提高了处理效率和并行性,同时降低了对相移器和微环谐振器的依赖,展示了在光子张量核心中的应用潜力,并在实际计算任务中实现了高准确率。这项突破有望推动光子处理器在人工智能领域的广泛应用。
50 5
|
5月前
|
数据采集 机器学习/深度学习 人工智能
【2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别】1 初赛Rank12的总结与分析
关于2021年第五届“达观杯”基于大规模预训练模型的风险事件标签识别竞赛的初赛Rank12团队的总结与分析,详细介绍了赛题分析、传统深度学习方案、预训练方案、提分技巧、加速训练方法以及团队的总结和反思。
54 0
|
8月前
|
机器学习/深度学习 算法
应用规则学习算法识别有毒的蘑菇
应用规则学习算法识别有毒的蘑菇
|
8月前
|
机器学习/深度学习 存储 编解码
彩票开奖彩票开奖BCFPL:基于二元分类的低分辨率图像快速停车位识别
彩票开奖BCFPL:基于二元分类的低分辨率图像快速停车位识别
90 0
|
8月前
|
数据可视化 数据挖掘 数据处理
R语言用决策树的酒店收入和产量预测可视化研究
R语言用决策树的酒店收入和产量预测可视化研究
|
8月前
|
算法 数据挖掘
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
|
数据采集
|
机器学习/深度学习 监控 数据格式
智能零售分析:使用YOLOv5进行客流量分析、商品识别和货架分析
智能零售分析:使用YOLOv5进行客流量分析、商品识别和货架分析
319 0
|
机器学习/深度学习 语音技术 数据库
文献分享丨GWAS分析菜用大豆可溶性糖含量调控基因
文献分享丨GWAS分析菜用大豆可溶性糖含量调控基因

热门文章

最新文章