中英文核心期刊咨询网

当前位置:首页>>农业论文 > 正文

肥城桃品质可视化与成熟期高光谱成像检测

发布时间:2021-12-29

  摘要:肥城桃采后转色快、易腐烂,导致果品等级下降。采用高光谱成像技术进行肥城桃可溶性固形物含量(SSC)和硬度可视化检测与成熟期预测,以提高果品质量,实现优果优价。首先采集成熟度 70%和 90% 各 80 个肥城桃高光谱信息及 SSC 和硬度,通过蒙特卡罗偏最小二乘法分析剔除异常值,利用光谱-理化值共生距离划分样本集,采用竞争性自适应权重取样法(CARS)和连续投影算法(SPA)选取特征波长,并建立多元线性回归(MLR)模型。结果表明:CARS-MLR 模型性能优于 SPA-MLR 模型,预测 SSC 的 CARS-MLR 模型, Rc 2 和 Rv 2 分别为 0.8191 和 0.8439, RPD 为 2,预测硬度的 CARS-MLR 模型, Rc 2 和 Rv 2 分别为 0.9518 和 0.8772,RPD 为 2.1。然后,基于 CARS-MLR 模型计算肥城桃每个像素点 SSC 和硬度,生成可视化分布图,实现不同成熟度肥城桃 SSC 和硬度可视化检测。最后,利用顺序前向选择算法优选特征波长,建立人工神经网络成熟期预测模型,获得 98.3%总识别准确率。

肥城桃品质可视化与成熟期高光谱成像检测

  关键词:肥城桃;SSC;硬度;成熟期;高光谱成像

  0 引言

  肥城桃,因产于山东省肥城市而得名,以个大味美、营养丰富享誉中外 [1]。肥城桃属于典型呼吸跃变型果实,鲜桃采摘后转色快,果肉易发生褐变进而导致软化与腐烂[2,3]。鲜食和短期贮藏肥城桃,宜成熟度 90%左右时采摘,若远途运输销售和长期贮藏,最好在成熟度 70%时收获。寻求快速、高效的检测方法,进行肥城桃品质预测与成熟期鉴别,可以提高果品质量,实现优果优价。

  高光谱成像技术将光谱与传统图像相结合,可以同时获取目标的空间和光谱信息,具有简便、快速、无损、准确等优点,已成功用于水果成熟度检测和果品分析[4 - 7]。文献[8]利用高光谱成像技术对不同成熟度樱桃进行分类,建立了樱桃果实 pH 值和可溶性固形物含量预测模型,从而实现樱桃品质可视化。文献[9] 应用高光谱成像技术结合特征波长对冬枣成熟度进行可视化判别,采用多种方法选择特征波长,建立的 PLS-DA 模型判别精度可达 90%以上。文献[10]采用高光谱成像技术,结合多个数据集的支持向量机分类模型对草莓成熟度进行了评价。此外,高光谱成像技术结合化学计量学方法在柿子、香蕉、蓝莓等水果成熟度分析及品质评价方面也取得了较好效果[11 - 13]。但关于肥城桃品质与成熟期高光谱成像检测的研究鲜有报道。

  本文以“金秋婉蜜” 肥城桃为研究对象,采集两种成熟期鲜桃(成熟度 70%和 90%)的高光谱信息,建立光谱信息与可溶性固形物含量(Soluble solids content,SSC)及硬度回归模型,进行果品可视化分析与成熟期预测。

  1 材料与方法

  1.1 肥城桃样本

  不同成熟期肥城桃如图1所示,成熟度70% (青熟期):桃子表面绿色逐渐褪减,整个果实表面少量着色,果实基本发育成型,质地较硬,耐贮藏。成熟度 90%(转色期):果实表面大都着色,极少部分区域呈淡黄色,果实稍有弹性,少量区域变软,香味浓郁。“金秋婉蜜”肥城桃种植于山东省肥城市刘台肥桃合作社果园,采摘时间为 2019 年 9 月 14 日上午,在有经验的果农指导下,随机采摘两种成熟期肥城桃并用水果泡沫网套包裹放入保鲜盒,运回实验室。选取形状大小均匀,无斑点、无疤痕的肥城桃作为实验样本,获得两种成熟度肥城桃样本各 80 个,对选取的样本进行编号,成熟度 70%样本编号 1 ~ 80,成熟度 90%样本编号 81 ~ 160,按照编号顺序进行光谱数据的采集和理化性质的测定。

  1.2 高光谱图像采集

  1.2.1 高光谱成像系统

  GaiaField 型便携式高光谱系统(四川双利合谱科技有限公司)组成如图 2 所示,主要包括 GaiaField-V10E 型高光谱成像仪、1 392 × 1 040 像素 HSIA-OL23 型成像镜头、4 组 HSIA-LS -T-200W 型对称分布专用光源、HSIA-TP-S 型三脚架以及配有高光谱数据采集软件 SpecView 的专用计算机等。光谱范围为 400 ~ 1 000 nm,光谱分辨率 2.8 nm,有效狭缝长度 9.8 mm,入射狭缝宽 30 μm,视场角 22°。通过创建 400 ~ 1 000 nm 的三维光谱立方体,研究所选像素特征,分析不同波长图像,进行果品预测与成熟期鉴别。

  1.2.2 图像采集和校准

  从保鲜盒取出桃子,待其恢复常温(20℃) 后,采集光谱数据。为了得到清晰图像,将样本与镜头距离设置为 300 mm,相机曝光时间设置为 15.2 ms。对高光谱成像系统进行黑白校正 [14],以消除光照及相机暗电流等对图像影响。

  1.3 理化指标测定

  肥城桃硬度测定使用 GY-1 型指针式水果硬度计(浙江托普云农科技股份有限公司),测头直径 3.5 mm,下压深度 10 mm,测试速度 0.5mm/s,选取 ROI 区域上中下 3 个位置进行测量,每个位置去除 1 cm 2 左右果皮后进行测定,取 3 个位置平均值为硬度值。使用 PAL1 型数显折射仪(日本爱拓公司)进行 SSC 测定,3 个位置上的测量平均值为肥城桃 SSC 测定值。

  1.4 数据处理

  1.4.1 异常值剔除

  肥城桃光谱数据采集及 SSC 和硬度测定时,由于仪器、环境和人为操作等因素产生数据误差,影响模型准确性,应对异常值进行剔除。蒙特卡罗偏最小二乘法(Monte carlo-partial least squares, MCPLS)以蒙特卡罗交互验证为基础,能够同时检测光谱异常值和理化性质异常值,根据交叉验证均方根误差(Root mean square error of cross validation, RMSECV)最小原则确定最佳主成分数,通过计算样本预测误差均值和标准差,具有较高均值和标准差的样本为异常样本 [15,16]。

  1.4.2 样本集划分

  采用光谱-理化值共生距离(Samples set partitioning based on joint X-Y distances, SPXY) [17]对经过样本剔除操作的 SSC 值、硬度按 2:1 比例进行建模集和预测集划分。通过计算建模集和预测集样本的最大值、最小值、平均值和标准偏差来评估样本划分是否合理。

  1.4.3 特征波段选取

  由于全光谱含有 256 个波长变量,大量共线性波长会导致信息冗余,从而增加计算量降低建模效率。采用竞争性自适应权重采样( Competitive adaptive reweighted sampling, CARS ) 算 法 、 连 续 投 影 算 法 ( Successive projections algorithm, SPA)和顺序前向选择(Sequential forward selection, SFS)算法进行特征波长选取。

  竞 争 性 自 适 应 权 重 采 样 ( Competitive adaptive reweighted sampling , CARS)算法是一种基于适者生存和回归系数进行波长选择的有效方法,先利用 PLS(偏最小二乘)模型筛选回归系数大的波长,再通过十折交叉验证优选出均方根误差最小的波长子集[18]。连续投影算法(Successive projections algorithm, SPA)是一种前向循环的特征变量筛选方法,能够滤除无效信息,大大降低数据间的共线性影响[19]。顺序前向选择(Sequential forward selection, SFS)算法作为机器学习中的启发式搜索方法,从一个空的特征子集开始自上而下搜索,每次将一个未选特征加入特征子集,使特征函数达到最优[20]。

  1.4.4 回归和分类模型的建立与评价

  多元线性回归(Multiple linear regression, MLR)是一种常用的建模方法,能够建立多个自变量与因变量的关系模型[19]。而 MLR 适用于变量数少于样本数的情况,所以本研究只对 CARS 和 SPA 提取的波长建立 MLR 模型。

  人工神经网络(Artificial neural network, ANN)是模拟人的大脑结构而产生的,由大量的神经元联接构成,具有很强的非线性函数逼近能力,拥有强大的容错性[21]。本研究采用 ANN对SFS提取的特征波长建立成熟度分类模型。

  回归模型建立后,将建模集决定系数 Rc 2 和建模集均方根误差作为回归模型性能的辅助评价指标,以预测集决定系数 Rv 2 ,预测集均方根误差和预测集实测值标准偏差以及预测均方根误差的比值(RPD)作为预测性能主要评价指标。当 RPD 小于 1.4,模型无法对样品进行预测,RPD 为 1.4 ~ 2,认为模型效果一般,可以对样品进行粗略评估,RPD 在 2 以上,模型具有极好的预测能力[22,23]。而成熟度分类模型的性能通过混淆矩阵进行评估。

  2 结果与分析

  2.1 肥城桃光谱特征

  去掉首尾噪声,对 400~1 000 nm 内 256 个波段进行光谱特征分析,获得肥城桃全部样本光谱曲线和平均光谱曲线如图 3 所示。由图 3 可以看出,不同成熟期肥城桃的平均光谱曲线变化趋势基本一致,450~650 nm 间两光谱曲线差距较大,说明不同成熟期肥城桃成分含量存在差异。其中,420 nm 和 680 nm 附近光谱吸收峰主要由肥城桃中类胡萝卜素和叶绿素吸收光谱引起[24,25],成熟度 70%肥城桃由于含有更多的叶绿素,在 680 nm 处有较大吸收峰。740 nm 和 980 nm 附近吸收峰与桃子内部水分有关,分别为 O-H 三级和二级倍频特征吸收峰[26, 27]。830 nm 附近吸收峰反映了肥城桃含糖量 [18]。

  2.2 异常样本剔除

  由于试验中产生的异常值会影响建模精度,采用 MCPLS 算法进行异常值剔除。蒙特卡罗检测结果如图 4 所示,以预测误差均值 1.17° Brix,标准差 0.25°Brix 为界限共剔除异常值 7 个,分别为 11、12、37、57、141、146、153 号,异常样本剔除后,决定系数 Rc 2 值由 0.7758 上升至 0.7976。而光谱值和硬度蒙特卡罗检测中,未出现较大偏离均值和标准差的数据,没有进行异常值剔除。

  2.3 样本集划分

  采用 SPXY 对剔除异常值的 SSC 值和未进行剔除异常值的硬度分别结合光谱值进行数据集划分,结果如表 1 所示。由表 1 可以看出建模集包含 SSC 和硬度的最大值和最小值,且分布范围较广,样本集划分合理。

  2.4 特征波段选取

  为了提高运行速度,挑选共线性最小,冗余最少的波长,采用 CARS 和 SPA 提取特征波长用来建立回归模型。图 5a 为 CARS 方法选择 SSC 特征波长过程,运行次数为 72 时,选取波段数为 42 个,占波长总量 16.4%。图 5b 为 CARS 方法选择硬度特征波长过程,运行次数为52时,选取波段数为 40 个,占波长总量 15.6%。

  图 6a 为 SPA 方法优选 SSC 特征波长分布,指定波长数 N=5 ~ 30,共优选出 11 个光谱波段,占波段总量 4.3%;图 6b 为 SPA 方法优选硬度特征波长分布,指定波长数 N=10 ~ 30,共优选出 11 个光谱波段,同样占波段总量 4.3%。

  2.5 MLR 模型建立

  建立 CARS 和 SPA 优选特征波长的 MLR 模型,回归模型效果如表 2 所示。表 2 中, CARS-MLR 模型性能优于 SPA-MLR 模型,用于预测 SSC 的 CARS-MLR 模型, Rv 2 =0.8439,预测集均方根误差为 0.5096°Brix,RPD 为 2.0, 用于预测硬度 的 CARS-MLR 模 型 , Rv 2 =0.8772 , 预 测 集 均 方 根 误 差 为 0.8585 kg/cm2,RPD 为 2.1。进一步,建立 SSC 和硬度 CARS-MLR 模型建模与预测散点图(图 7),可以看出 CARS-MLR 模型对 SSC 和硬度均取得了较好预测结果。

  2.6 SSC 和硬度可视化检测

  利用 CARS-MLR 模型估算肥城桃每个像素点 SSC 和硬度,运用伪彩图处理技术生成 SSC 和硬度分布图,不同颜色和深浅程度代表不同成熟度肥城桃 SSC 和硬度,结果如图 8 所示。SSC 图中,成熟度 90%桃子主要呈深黄色, SSC 主要集中在 12°~ 15°Brix,成熟度 70% 桃子主要呈浅黄色,SSC 主要集中在 10°~ 13°Brix,成熟度90%桃子SSC高于成熟度70% 桃子。图 8b 中,成熟度 90%桃子主要呈浅绿色,硬度主要集中在 3 ~ 8 kg/cm2,成熟度 70%桃子主要呈浅黄色和绿色,硬度主要集中在 6 ~ 12 kg/cm2,成熟度70%桃子硬度值高于成熟度90% 桃子。SSC 图中桃子外蓝色区域及硬度图中桃

  2.7 成熟期预测

  为了快速准确预测肥城桃成熟期,采用SFS 算法进行特征波长提取。搜索过程中,SFS 算法分别以 14.120、13.432 和 12.613 的标准值挑选出 3 个特征波长 493 nm、530 nm、720 nm,如图 9 所示。以 SFS 特征波长为输入,建立 ANN 预测模型。对虚拟等级值分别为 0、1 的成熟度 70%、成熟度 90%肥城桃样本按 5:3 划分建模集和预测集,参数设置为:最大训练次数 100、学习速率 0.1、目标误差 0.1。通过混淆矩阵图 10 可以看出,肥城桃成熟期预测总准确率为 98.3%,结果较为理想。

  3 结论

  (1) 基于 CARS 和 SPA 提取特征波长建立 MLR 预测模型。其中,CARS-MLR 预测性能优于 SPA-MLR,预测 SSC 的 CARS-MLR 模型, Rc 2 和 Rv 2 分别为 0.8191 和 0.8439,建模集和预测集均方根误差分别为 0.5290°Brix 和 0.5096 ° Brix , RPD 为 2 ,预测硬度的 CARS-MLR 模型, Rc 2 和 Rv 2 分别为 0.9518 和 0.8772,建模集和预测集均方根误差分别为 0.6263 kg/cm2 和 0.8585 kg/cm2,RPD 为 2.1。

  (2) 利用 CARS-MLR 预测模型计算不同成熟度肥城桃每个像素点 SSC 和硬度,生成可视化分布图,实现不同成熟度肥城桃 SSC 和硬度无损评价,有助于肥城桃品质在线检测。

  (3) 基于 SFS 特征波长建立 ANN 模型对采后肥城桃进行成熟期预测,获得 98.3%总识别准确率,表明高光谱成像技术能够实现肥城桃成熟期预测。——论文作者:邵园园 1,2 王永贤 1 玄冠涛 1,3 高 冲 1 王凯丽 1 高宗梅 4

  参 考 文 献

  [1] 刘伟,李桂祥,董晓民,等. 肥城桃产业的现状及发展建议 [J]. 落叶果树,2019,51(3) : 32 - 33. LIU Wei,LI Guixiang,DONG Xiaomin,et al. Present situation and development suggestion of peach industry in feicheng [J]. Deciduous Fruits,2019, 51(3) : 32 - 33.

  [2] GINE J,EDUARDO I,ARUS P,et al. Biochemical and genetic implications of the slow ripening phenotype in peach fruit [J]. Scientia Horticulturae, 2020,259 : 108824.

  [3] 薛建新,张淑娟,张晶晶. 基于高光谱成像技术的沙金杏成熟度判别[J]. 农业工程学报,2015, 31(11) : 300 - 307. XUE Jianxin,ZHANG Shujuan,ZHANG Jingjing. Ripeness classification of Shajin apricot using hyperspectral imaging technique [J]. Transactions of the CSAE,2015,31(11) : 300 - 307.(in chinese)

  [4] MUNERA S,AMIGO J M,BLASCO J,et al. Ripeness monitoring of two cultivars of nectarine using VIS-NIR hyperspectral reflectance imaging [J]. Journal of Food Engineering,2017,214 : 29 - 39.

  [5] 李鸿强,孙红,李民赞. 基于可见/短波近红外光谱检测结球甘蓝维生素 C 含量 [J]. 农业工程学报,2018, 335(8) : 277 – 283. LI Hongqiang,SUN Hong,LI Minzan. Detection of vitamin C content in head cabbage based on visible/near-infrared spectroscopy [J]. Transactions of the CSAE,2018, 335(8) : 277 – 283.

  [6] SUN Y,GU X,SUN K,et al. Hyperspectral reflectance imaging combined with chemometrics and successive projections algorithm for chilling injury classification in peaches [J]. LWT,2017,75 : 557 - 564.

  [7] TEERACHAICHAYUT S,HO H T. Non-destructive prediction of total soluble solids,titratable acidity and maturity index of limes by near infrared hyperspectral imaging [J]. Postharvest biology and technology,2017,133 : 20 - 25.

  [8] LI X,WEI Y,XU J,et al. SSC and pH for sweet assessment and maturity classification of harvested cherry fruit based on NIR hyperspectral imaging technology [J]. Postharvest Biology and Technology,2018,143 : 112 - 118.

回到顶部