Optimized wavelength selection for eggplant seed vitality classification using information
acquisition techniques
研究单位:河北农业大学
摘要:
茄子种子活力是表征种子发芽率与幼苗生长品质的核心指标。针对高效、无损种子活力检测的行业需求,本文融合高光谱成像技术、先进特征筛选算法与分类模型,开展茄子种子生活力无损检测研究。采用高光谱成像系统采集茄子种子光谱数据,光谱区间395.24~1008.20 nm,共 360 个波段;通过微波加热、恒温水浴两种方式对种子进行人工老化处理。采用多元散射校正(MSC)、SG平滑、标准正态变量变换(SNV)三种方法完成光谱数据预处理。本文提出增强型信息获取优化算法(EIAO) 用于特征波长筛选,最终筛选出23 个最优关键特征波段。分别构建极限学习机(ELM)、随机森林(RF)、支持向量机(SVM)三类种子活力分类模型,模型最优分类准确率分别为90.0%、91.45%、90.5%。其中MSC-EIAO-RF组合模型综合性能最优,测试集准确率达91.45%,较 MSC-IAO 模型(82.41%)提升9.04%。基于 4 组 UCI 公开数据集开展泛化性验证,结果证明 EIAO 算法性能优于传统特征筛选方法。研究证实,高光谱成像结合EIAO 算法可实现种子活力稳定、通用的无损检测,为种子品质智能高效检测提供全新技术方案。
数据采集:
本次实验数据采集使用HG101便携式高光谱成像系统。该高光谱成像仪具有内置推扫及双探测器的独特设计,集成度高,操作便捷,可用于野外、实验室或显微测量,快速获得观测目标在400~1000nm内的高光谱图像数据,广泛应用于环境遥感、精准农业、物种分类、农林遥感、植物科学、果实/种子品质、成分分析等领域。
研究过程:
图1 高光谱数据采集系统与人工老化茄子种子样本 (A)高光谱数据采集系统;(B)人工老化茄子种子样本:(a)空白对照组;(b)水浴老化组;(c)微波老化组
表1 各算法参数设置
图2本文所提EIAO 算法流程图
图3 高光谱反射曲线及预处理效果 (A)原始平均反射光谱;(B)多元散射校正(MSC)预处理;(C)标准正态变量变换(SNV)预处理;(D)SG平滑预处理
表2 本研究采用的UCI 数据集基础信息
表3 EIAO 与 5 种基准算法在种子光谱数据集上的性能对比
表4 特征波长在全光谱波段中的分布占比
图4 EIAO 算法在 4 组茄子种子数据集上的收敛性能对比 (A)数据集 DS_1;(B)数据集 DS_2;(C)数据集 DS_3;(D)数据集 DS_4
图5 EIAO 与 5 种基准算法在 4 组种子数据集上的稳定性分析 (A)数据集 DS_1;(B)数据集 DS_2;(C)数据集 DS_3;(D)数据集 DS_4
表5 全波段与特征波长分类模型准确率
表6 不同预处理与特征筛选方案下平均精确率、召回率及F1 分数对比
表7 EIAO 与 5 种基准算法在 UCI 数据集上的性能对比
图6 EIAO 与 5 种基准算法在 4 组 UCI 公开数据集上的稳定性分析 (A)电离层数据集;(B)心律失常数据集;(C)车辆数据集;(D)投票数据集
研究结论:
本研究探究了高光谱成像技术用于茄子种子活力无损检测的可行性。提取茄子种子感兴趣区域的高光谱数据,采用多元散射校正(MSC)、标准正态变量变换(SNV)、SG平滑三种预处理算法去除光谱噪声;提出增强型信息获取优化算法(EIAO)筛选特征波长,并分别构建极限学习机(ELM)、随机森林(RF)、支持向量机(SVM)三种种子活力分类模型。试验结果表明:相较于原始光谱数据,光谱预处理结合特征波长筛选能够显著提升模型分类效果,其中基于 EIAO 算法的特征筛选方案优化效果最为突出。经特征波长优化后,随机森林与支持向量机模型具备优异的泛化能力,在测试集上取得了较高识别精度。尽管采用筛选后的特征波长建模会损失少量原始光谱信息,但能够大幅削减数据冗余度,显著提升分类准确率。本研究证实,特征波长筛选是实现高精度建模的关键环节。后续研究可进一步融合纹理等多维度光谱信息,持续提升模型识别性能。
原文链接:https://doi.org/10.3389/fpls.2025.1584269