论文部分内容阅读
众所周知,玉米是世界三大粮食作物之一,在生产和生活中扮演着重要的角色。它既可以作为食品加工原料,又可以作为畜禽饲料和工业原料。玉米具有产量大,种植面积分布广的特点,一直在我国农业生产和国民经济中一直占据着重要地位。因此,如何准确检测玉米品质并进行分级,就成为了一个有意义的问题。近年来近红外光谱技术得到迅猛发展,而且日益成熟。该技术不仅涉及光谱测量学领域的内容,而且通常还要结合化学计量学、计算机科学等多个学科的专业知识。近红外光谱技术分析得以广泛应用,是因为它是一种间接的测量方法,用它来检测样品成分含量的时候不需要破坏样品,也不需要消耗其它化学试剂来测量样品,因此就不会对环境造成破坏,而且测量的精度还很高。如果将计算机领域最新的方法和技术应用到近红外技术,通常可以得到比较好的分析结果。由于近红外光谱分析技术是一种间接的分析技术,要实现对未知样品的定量分析,需要建立合适的校正模型。论文采用广泛应用的偏最小二乘法。同时,光谱数据一般变量较多,存在大量冗余,如果使用全光谱建模,将会导致预测误差增大和稳定性变差的问题。因此,如何减少变量数目并选出最优变量组合建立模型就成为了关键问题。论文在借鉴遗传联合区间偏最小二乘法(Genetic Algorithm Synergy Interval Partial Least Squares,GA-siPLS)的基础上,提出了多种群遗传联合区间偏最小二乘法(Multigroup Parallel Genetic Algorithm Synergy Interval Partial Least Squares,MPGA-siPLS),其思路就是先将全光谱连续均匀的分成若干个区间,分别计算每个区间的PLS模型的均方根误差,选择均方根误差较小的几个区间组成新的光谱数据库,然后用多种群遗传算法做波长选择,最后用选择的波长组合建立模型。论文用一个公开数据库对所提算法进行了验证。这个数据库是由80个玉米样本组成,为了采集数据,使用了三种不同的NIR光谱仪来测量样品,整个光谱范围为1100-2498nm,光谱分辨率为2nm,即每个样本有700个光谱数据。每个样品的特征值包括水分、含油量、蛋白质含量和淀粉值。论文用新提出的方法定量分析了玉米中的几个主要成分,并且和GA-siPLS、遗传算法偏最小二乘法(Genetic Algorithm Partial Least Squares,GA-PLS)、全光谱偏最小二乘法(PLS)以及多种群遗传算法偏最小二乘法(Multigroup Parallel Genetic Algorithm Partial Least Squares,MPGA-PLS)等方法进行了对比,实验结果表明:(1)先行进行区间选择,不但能减少波长选择数量,节约计算时间,而且预测精度会更好;(2)使用多种群遗传算法做波长选择,不仅收敛速度更快,而且会得到更小的均方根误差,即多种群遗传算法做频率选择具有明显的优势;(3)多种群遗传算法联合区间偏最小二乘法结合了两者的优势,发挥了两者的优点,得到了更好的预测结果。