• 书信范文
  • 文秘范文
  • 党团范文
  • 工作总结
  • 工作计划
  • 工作报告
  • 心得体会
  • 合同范文
  • 节日大全
  • 自我鉴定
  • 演讲稿
  • 汉字意思
  • 其他范文
  • 当前位置: 天一资源网 > 条锈病 正文

    基于CC-MPA特征优选算法的小麦条锈病遥感监测

    时间:2023-01-24 12:15:03 来源:天一资源网 本文已影响 天一资源网手机站

    竞 霞 闫菊梅 邹 琴 李冰玉 杜凯奇

    (西安科技大学测绘科学与技术学院, 西安 710054)

    小麦条锈病是一种发生范围广、危害程度大的病害,严重影响小麦的产量和质量[1]。高光谱遥感数据维数高、信息量丰富,能够更好地反映植物受胁迫信息,被广泛应用于小麦条锈病的遥感监测[1-3],但也存在数据冗余、波段间相关性高的问题[4]。从丰富的光谱数据中提取敏感光谱特征能够减少数据间的冗余,抑制噪声干扰,提高作物病害的监测精度,然而不同的特征选择算法对作物病害遥感监测模型构建的精度和效率具有重要影响[5]。目前常用的遗传算法(Generalized algorithm,GA)[6-7]、粒子群优化算法(Particle swarm optimization,PSO)[8]和离散粒子群(Discrete binary particle swarm optimization,DBPSO)算法[9]等智能优化特征选择算法虽然能够较好地保留变量之间的组合优势,但是这类算法结构较复杂,输入参数多,耗时长,影响了模型的实用性[10];
    无信息变量消除法(Uninformative variables elimination,UVE)[5-6]和连续投影算法(Successive projection algorithm,SPA)[11-13]能够降低变量之间的共线性,然而该类方法稳定性较差,提取的波长可能存在干扰变量,影响模型的预测精度[13]。除了这些基于波长点的特征变量选择算法外,还有基于波长区间的CC法[7,9]、间隔偏最小二乘(Interval partial least square,iPLS)[14]和后向区间间隔偏最小二乘(Backward interval partial least square,BIPLS)[15]等特征选择算法,这类算法选出的波长为连续分布的波段,具有较好的解释性[16],但相邻波长变量之间往往具有较强的共线性特征,存在冗余变量,建模时难以达到最佳结果[17]。上述光谱特征选择方法主要以一次建模为基础,数据处理易受样本个数的影响[18]。针对这个问题,文献[19-21]提出了基于MPA思想的特征选择方法,该方法能够最大限度地利用已有样本集的信息,在众多变量中鉴定有信息变量、无信息变量和干扰变量,通过分析变量之间的相互作用选出最优变量组合。基于MPA思想的特征选择算法弥补了一次性建模分析的缺点,能够增强模型预测结果的准确性和可解释性。

    波长区间算法和波长点算法在特征选择中各有优点,波长区间选择算法是一种粗略选择特征变量的方法,能够在去除无信息变量的同时不遗漏关键变量,波长点选择算法能够精准选择重要变量,在保留较少变量的同时,取得较好的建模效果[22]。基于此,本文提出联合CC与MPA的特征变量优选算法。首先使用CC方法进行波长区间的粗略选择,去除无信息变量确定最优特征波长谱区。然后利用基于MPA思想的CARS法和VCPA法精准选择对小麦条锈病严重度敏感的特征变量,并在此基础上采用PLSR算法建立小麦条锈病遥感监测模型。最后将该方法与仅利用CC、CARS、VCPA特征选择结果和建模精度进行对比分析,评价联合CC与MPA的特征变量优选算法在小麦条锈病遥感监测中的有效性,以期为高光谱数据选取特征变量进行病虫害遥感监测提供参考。

    1.1 试验设计

    试验区位于河北省廊坊市中国农业科学院试验站(39°30′40″N,116°36′20″E),小麦品种为对条锈病敏感的铭贤169号,平均种植密度为113棵/m2。2018年4月9日采用质量浓度为90 mg/L的孢子溶液对小麦进行条锈病接种。试验区域小麦分为健康组(编号为A、D)和染病组(编号为B、C),每个试验组面积为220 m2,分为8个样方,即健康组和染病组各16个样方。

    1.2 数据获取

    1.2.1冠层光谱测量

    本次试验于2018年5月18日测定小麦条锈病不同病情严重度下的冠层光谱数据。冠层光谱测量所使用仪器为ASD Field Spec 4型地物光谱仪,其光谱分辨率为3 nm,采样间隔1.4 nm,采样波长范围350~2 500 nm,测量时间为11:00—12:30,测量高度距离地面1.3 m,探头视场角25°,共设有62个采样点,每个采样点观测10次并对观测结果取平均作为该采样点的光谱数据,每次测量前后均用标准BaSO4参考板对冠层辐亮度数据进行校正。

    1.2.2病情指数调查

    冠层病情指数调查采用5点取样法,在每个样方内选取对称的5点,每点约1 m2,随机选取30株小麦,分别调查其发病情况。病情严重度参照国家标准[23]进行量化。单叶严重度分为9个梯度,即0、1%、10%、20%、30%、45%、60%、80%和100%的叶片病斑覆盖,分别记录各病情严重度的小麦叶片数,计算不同梯度测试群体的病情指数

    (1)

    式中DI——病情指数,%

    i——梯度

    x(i)——各梯度级值

    t——最高梯度,取9

    f(i)——各梯度叶片数

    1.3 基于MPA思想的特征选择算法

    MPA的主要思路是通过随机采样对样本集中的特征变量信息进行采样并建立子模型,然后利用子模型构建新的样本空间,通过模型的回归系数等参数对新的样本空间进行进一步统计分析,以此获得有用信息[19]。基于该思想,本文选择了CARS和VCPA 2种特征选择算法进行比较。

    CARS是一种综合蒙特卡洛采样法(Monte Carlo sampling,MCS)和PLSR算法的特征波长变量选择方法[24]。该方法通过指数衰减函数(Exponentially decreasing function,EDF)和自适应加权重采样技术(Adaptive reweighted sampling,ARS)选取回归系数较大的波长和建模时均方根误差(RMSE)最小的变量组合[25]。VCPA是考虑变量之间相互作用的一种特征波长选择算法,该方法采用二进制矩阵采样法(Binary matrix sampling,BMS),每个变量被选中的机会是相等的[26],通过EDF确定保留波长的数量,缩小变量空间,运用PLSR计算剩余变量子集之间所有组合的RMSE并进行排序优选[27]。两种特征选择算法流程见图1。

    图1 基于MPA的特征选择算法流程图Fig.1 Flowchart of feature selection algorithms based on MPA

    1.4 模型构建与评价方法

    1.4.1光谱数据集的划分

    为了评价所建模型的可靠性和稳定性,本文分别选用随机划分(Random sampling,RS)法、Kennard-Stone(KS)法和光谱-理化值共生距离(Sample set partitioning based on joint x-y distance,SPXY)法对62个样本集按照3∶1的比例划分训练集和验证集。各划分方法的原理如下:

    (1)RS法

    RS法是随机选取一定数量的样本构成训练集和验证集,每个样本被选中的概率相同,无规律可循,能保证样本数据集的随机性[28]。

    (2)KS法

    KS法是按照样本光谱空间中的欧氏距离进行样本划分的方法。首先选择欧氏距离最大的2个样本构建数据集A,然后在剩余样本中选出与A样本中欧氏距离最大的样品加入到建模样品集,循环进行计算,直至挑选出足够样本数量的建模集,此时将剩余样本作为预测集样本[29]。该方法优点是能保证训练库中样本按照空间距离分布均匀,缺点是需要进行数据转换和计算样本两两空间距离,计算量大。

    (3)SPXY法

    SPXY法是一种同时考虑样本光谱信息以及生化参量欧氏距离的样本集选择方法,所选样本集更具有代表性[30]。SPXY法与KS法的原理和步骤相似,主要区别是欧氏距离的计算公式不同。

    (2)

    其中

    (3)

    dy(a,b)=|ya-yb|

    (4)

    式中dxy(a,b)——样本光谱信息与被测指标参量的样本a和b之间的距离

    dx(a,b)——样本a和样本b间x变量的欧氏距离

    dy(a,b)——样本a和样本b间y变量的欧氏距离

    xa(j)——样本a在第j个波长处的光谱信息值

    xb(j)——样本b在第j个波长处的光谱信息值

    ya——样本a的被测指标参量

    yb——样本b的被测指标参量

    m——样本光谱波长总数

    n——样本总数

    1.4.2模型构建与评价

    在对冠层光谱反射率矩阵与病情指数矩阵进行主成分分解的基础上利用PLSR算法构建小麦条锈病遥感监测模型。该算法是由多元线性回归分析、主成分分析和典型相关分析组合而成的算法,能够在自变量存在严重多重相关性的条件下进行有效回归建模,增加了预测准确性[31]。

    选择DI预测值和实测值之间的决定系数R2、均方根误差(RMSE)和相对分析误差(RPD)对模型性能进行评价。对于同一样本集,R2越大,RMSE越小,RPD越大,说明所建模型的预测能力和稳健性越高。其中,当RPD大于等于2时,表明模型可对样本进行有效估测;
    当RPD在1.4~2之间时,表明模型可对样本进行粗略估测;
    当RPD小于1.4时,表明模型不能对样本进行估测[32]。

    2.1 基于MPA思想的特征变量选择

    2.1.1CARS算法优选的特征变量

    利用CARS算法优选特征变量过程如图2所示。由图2a看出,随着采样次数的增加,被选择的特征变量数逐渐减少,结合图2b、2c可知,RMSE在采样次数为309时最小,表示此处冗余信息量最小,之后随采样次数的增加开始缓慢增大,这是因为此时光谱数据中的关键信息被剔除,模型的性能变差,因此选择RMSE最小值对应的图3中22个特征子集作为遥感监测小麦条锈病的最优特征变量。CARS算法筛选出来的特征波长变量分别为767、837、842、907、923、926、940、941、1 271、1 274、1 284、1 295、1 296、1 300、1 301、1 305、1 306、1 317、1 321、1 323、1 338、1 340 nm,占总变量数的2.191%。

    图2 CARS选择特征变量过程Fig.2 Process of CARS selecting feature variables

    图3 CARS算法优选的特征变量Fig.3 Feature variables selected by CARS algorithm

    2.1.2VCPA算法优选的特征变量

    采用VCPA算法优选特征变量时,需要设置采样和迭代次数等参数,各参数初始值设置如表1所示。首先利用BMS对光谱数据进行1 000次采样得到1 000组变量子集,对这些变量子集建立PLSR模型,从中选出RMSE最小的100组变量子集进行EDF运算,最后建立模型计算保留下来的14个变量之间所有可能组合的RMSE值,其中最小值对应的变量即为最终选择的最优特征变量组合[33]。采用VCPA优选的对小麦条锈病敏感的特征变量如图4所示,分别为415、508、513、528、533、647、648、803、1 022、1 288、1 295 nm,共11个特征波长变量,占总变量数的1.099%。

    表1 VCPA算法运行参数设置Tab.1 VCPA algorithm operation parameters setting

    图4 VCPA算法优选的特征变量Fig.4 Feature variables selected by VCPA algorithm

    2.1.3CARS和VCPA算法比较

    为了评价CARS和VCPA 2种算法的稳定性,以运行次数50为例,对比分析了不同波长光谱被选为特征变量的频次(图5)。从图5可以看出,CARS选择的变量较多,涉及297个波长变量,主要集中在近红外波段750~1 350 nm,其中在波段1 280~1 320 nm范围内选择频次最高,该波段是冠层叶片结构变化特征反映区[34]。VCPA选择的变量在全谱区域均有分布,包含的信息更全面,主要分布在400~420 nm叶绿素吸收带,500~550 nm反映类胡萝卜素的黄绿光反射区,640~670 nm叶绿素b吸收峰范围,还有800~870 nm、1 000~1 030 nm和1 270~1 330 nm受叶片含水量影响的近红外波段,该算法选择的变量比CARS少,共涉及到177个波长变量,稳定性更好。产生这种现象的原因是2种算法的采样策略不同,CARS采用的MCS采样策略随机选择变量,倾向于选择较多的变量,每个变量被选择的机会是不确定的[35]。而VCPA采用的BMS采样策略,为每个变量提供相同的采样概率,通过EDF压缩变量空间,消除无关变量,采用MPA思想保留了前10%最优的变量子集,重要变量被最终选择的几率相对较大,所以最终保留的变量较少[36]。

    图5 不同波长光谱被选为特征变量的频次Fig.5 Frequency of different wavelength spectra selected as feature variables

    2.2 基于CC方法优选的特征变量

    CC是反映变量之间线性相关程度的统计指标,数值越高表明该变量对于待测目标属性越重要。本文利用Pearson相关系数分析法计算小麦条锈病DI与冠层光谱反射率的相关性(图6)。由图6可以看出,可见光577~703 nm和近红外735~962 nm、1 001~1 099 nm波段内的光谱反射率与小麦条锈病严重度的相关性分别达到了极显著正相关和极显著负相关,这是因为色素吸收决定着可见光波段的光谱反射率,细胞结构决定近红外波段的光谱反射率。随着条锈病菌侵染程度的加重,小麦叶片褪绿变黄,叶绿素被大量破坏,叶片细胞尺寸、形态、结构组织均发生变化,水分蒸腾量显著增加[37]。选择出与小麦条锈病DI达到极显著相关的波段区间作为小麦冠层条锈病病情监测模型的输入变量,共454个波长特征变量,占总变量数的45.355%。

    图6 DI与冠层光谱反射率的相关系数Fig.6 Correlation coefficient between DI and canopy spectral reflectance

    2.3 模型构建与精度评价

    在进行小麦条锈病严重度模型构建和精度评价时,为了使评价结果更客观,本文分别采用RS法、KS法和SPXY法将62个样本集按3∶1的比例进行3次分组,每组中45个数据作为训练样本用于模型构建,剩余的17个数据作为验证样本用于模型评价。

    2.3.1CARS和VCPA模型

    表2 不同特征选择方法PLSR建模精度Tab.2 PLSR modeling accuracy of different feature selection methods

    2.3.2CC-CARS和CC-VCPA模型

    将基于波长区间粗选的CC方法和基于波长点精选的CARS和VCPA方法联用,能够充分利用它们的优势,精准选择重要变量,达到更好的建模效果。首先对全波段光谱进行CC优选,去除相关性较小的变量,将基于CC法选择的变量作为新变量利用CARS和VCPA进一步进行筛选,并利用PLSR算法分别建立了小麦条锈病遥感监测的CC-CARS和CC-VCPA模型,各模型预测DI和实测DI之间的R2、RMSE和RPD如表3所示。

    表3 联合CC的不同特征选择方法PLSR建模精度Tab.3 PLSR modeling accuracy of different feature selection methods combined with CC

    为了更直观地显示CC-MPA方法选择的特征变量在小麦条锈病遥感监测中的有效性,RS、KS和SPXY 3组样本集中RMSEV和选择特征变量数(Number of variables,nVAR)从全波段到最优特征变量选择的变化趋势如图7所示。由图7可以看出,本文所提出的CC-MPA特征选择方法不断地将全波段变量空间从CC粗选收缩到最优选择CC-CARS与CC-VCPA,整体上RMSEV和nVAR都呈现下降的趋势,在由CC粗选到CC-CARS与CC-VCPA精选的过程中,RMSEV下降的速度变快,nVAR降低到最少,最后获得一个变量更少且精度更高的特征子集。同时CC-CARS和 CC-VCPA分别与单次CARS和VCPA建模结果相比,nVAR和RMSEV均进一步减少,说明联合CC与MPA的特征优选方法能够有效收缩特征变量空间并提高预测结果精度。

    图7 不同方法选择的特征变量数(nVAR)和RMSEV的变化曲线Fig.7 Variation trend of nVAR and RMSEV selected by different methods

    与CC特征选择方法相比,基于MPA思想的CARS和VCPA算法能够更加有效地提取对小麦条锈病敏感的特征变量,提高小麦条锈病遥感监测精度和建模效率。这是因为基于MPA思想的特征选择方法能最大限度地利用已有样本集信息,更好地分析光谱变量间的组合效应,进而得到最优特征变量[38]。利用CC法提取的特征波段建立模型的预测精度较低,主要原因是CC方法虽然在一定程度上可以剔除包含冗余信息的变量,但仍然存在保留变量多和筛选结果中存在较低信噪比变量等不足,导致模型容易出现过拟合现象[39]。

    利用CC-MPA算法优选的特征变量构建的小麦条锈病遥感监测模型精度优于单一的CARS和VCPA算法。这是因为联合CC与MPA的特征选择方法能够综合波长区间算法和波长点算法的优点,在利用CC算法对全波段进行粗选去除无信息变量的基础上,进一步利用MPA方法精选重要变量,保留较少变量的同时建立更稳健的模型,取得更好的建模效果。此外,利用CC-VCPA算法选择的特征变量数最少,构建的模型精度最高,这是因为CARS和VCPA 2种算法的采样策略不同。CARS算法基于MCS策略随机选择变量,每个变量被选择的概率不同,不能充分评价每个变量的重要性,导致该算法选择的特征波长较多且相对比较集中,缺失了部分有用信息,多样性不足[35],进而影响模型的预测准确性。而VCPA算法采用BMS采样策略,每个变量都有相同的被选择概率[36],提取的变量在全谱区域均有分布,信息量丰富,提高了特征波长的多样性,因此模型的精度较CARS算法有了明显提高。

    本研究只选择基于MPA思想的2种特征选择算法进行分析,由于不同类型特征选择算法对变量筛选的原理不同,如果使用更多的特征选择算法进行试验,CC-VCPA方法是否仍为遥感探测小麦条锈病的最优特征选择算法尚需进一步探讨。此外,为了充分发挥特征选择算法之间的互补性,在后续研究中可以将智能优化算法、SPA算法等特征选择方法与本文方法联合进行特征变量的三重优选,以进一步探讨更优的光谱特征优选方法。

    在分析CC-MPA方法提取小麦条锈病遥感监测的敏感因子时,本研究仅利用了原始反射率光谱数据,若增加能够敏感反映作物光合生理特征的叶绿素荧光数据及反映不同生化组分含量、冠层几何结构的植被指数特征,是否可以提高模型监测精度有待考证。

    本研究的样本数据主要为小区控制试验条件下小麦灌浆期测定的近地高光谱数据,小麦品种、生育期以及其它病虫害等因素对冠层光谱的影响较小,因此该研究结果能否外推到不同光谱分辨率、不同空间分辨率的卫星影像上,还需利用更多的数据进一步分析。

    (1)为从全波段光谱数据中优选出对小麦条锈病敏感的特征变量,提高小麦条锈病遥感监测精度,提出了联合CC与MPA思想的特征变量选择方法,对比分析CC、CARS、VCPA以及CC-CARS、CC-VCPA几种特征变量选择方法对小麦条锈病遥感监测精度的影响。

    (2)CARS和VCPA算法均能在减少特征变量的同时提升模型预测效果。CARS和VCPA算法分别选择了22个和11个对小麦条锈病敏感的光谱特征,极大地减少了特征变量数,提高了模型运行效率。在3组样本集中,基于CARS和VCPA算法优选特征变量建立的小麦条锈病遥感监测模型的精度较全波段和CC方法均有不同程度的提高。与CARS相比,VCPA算法选择的变量数更少,模型预测精度更高,表明VCPA算法可以有效选择对小麦条锈病敏感的特征变量,简化模型并提高运算效率,增强模型可靠性。

    (3)联合CC与MPA的特征变量选择方法能够提高小麦条锈病遥感监测精度。将CC法与基于MPA思想开发的CARS和VCPA算法联合优选对小麦条锈病敏感的特征变量,并在此基础上构建的模型精度较单一的CC、CARS和VCPA模型均有不同程度的提高,其中以CC-VCPA模型预测结果最好,3组样本集中验证模型预测DI和实测DI间的RPD均大于2,表明CC-MPA是一种有效的特征变量优选算法。研究结果为高光谱特征变量优选及提高作物病害监测精度提供了研究方法和思路,具有重要的参考价值。

    猜你喜欢 条锈病特征选择波长 杯中“日出”阅读(科学探秘)(2021年8期)2021-09-01小麦条锈病的病因分析及防控措施农民致富之友(2020年22期)2020-09-02小麦条锈病的防控技术农民致富之友(2020年12期)2020-05-11河南省小麦条锈病的病因分析及防控措施农民致富之友(2019年20期)2019-07-27小麦条锈病持续控制的策略农民致富之友(2019年16期)2019-07-01紫外分光光度法测定溶血率的研究中国民族民间医药·下半月(2016年12期)2017-01-19基于智能优化算法选择特征的网络入侵检测现代电子技术(2016年23期)2017-01-12故障诊断中的数据建模与特征选择电脑知识与技术(2016年25期)2016-11-16reliefF算法在数据发布隐私保护中的应用研究电脑知识与技术(2016年15期)2016-07-04一种多特征融合的中文微博评价对象提取方法电脑知识与技术(2016年14期)2016-06-30 相关关键词: 条锈病
    相关热词搜索: 条锈病 优选 遥感

    • 范文大全
    • 教案下载
    • 优秀作文
    • 励志
    • 课件
    • 散文
    • 名人名言