预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107144548A(43)申请公布日2017.09.08(21)申请号201710373649.1(22)申请日2017.05.24(71)申请人长春理工大学地址130022吉林省长春市卫星路7089号(72)发明人宦克为韩雪艳刘小溪赵环石晓光(74)专利代理机构长春市吉利专利事务所22206代理人李晓莉(51)Int.Cl.G01N21/359(2014.01)权利要求书1页说明书4页附图3页(54)发明名称基于蒙特卡洛变量组合集群的近红外光谱变量选择方法(57)摘要本发明涉及基于蒙特卡洛变量组合集群的近红外光谱变量选择方法,属于分析化学和光谱学领域。具体实施过程如下:首先通过蒙特卡洛采样方法对校正集样本进行随机采样,其次通过变量组合集群分析法对每个样本子集进行特征变量选取,保留所有样本子集的特征变量得到一个新的变量空间,之后运用变量组合集群分析法对这个新的变量空间进行进一步的特征变量选取。本发明方法不仅通过二进制矩阵采样方法实现对变量空间的采样,同时还通过蒙特卡洛采样方法实现了对样本空间的采样,避免了样本集合变化对变量选择的影响。CN107144548ACN107144548A权利要求书1/1页1.基于蒙特卡洛变量组合集群的近红外光谱变量选择方法,其特征在于,包含以下步骤:A运用蒙特卡洛采样方法对校正集样本进行随机采样,每次采样80%的样本作为样本子集,采样M次得到M组不同的样本子集,M值为50;B针对每个样本子集首先运用二进制矩阵采样方法对其变量空间进行变量采样,采样K次得到K组不同的变量合集,K值为1000,运用偏最小二乘法建立每个变量合集的模型,得到每个变量合集的交互检验均方根误差;C针对每个样本合集,选取其均方根误差最小的前θ×K组变量子集作为每个样本子集的变量子集,其中θ为10%,θ×K为100,统计每个变量子集中每个光谱变量出现的频率,运用指数衰减函数删除那些出现频率较小的变量;D步骤B~步骤C过程迭代N次,N值为50,最后每个样本子集中只剩下L个光谱变量,L的数值为14,计算出每个样本子集中L个变量之间所有变量组合的均方根误差,其值最小的变量组合为每个样本子集的特征变量;E保留所有样本子集中的特征变量,最后通过对所保留的变量重复二进制矩阵采样法变量采样、变量子集选取和指数衰减函数删除贡献小变量,此过程迭代N1次,N1值为200,最后剩余L个变量,计算出每个样本子集中L个变量之间所有变量组合的均方根误差,其值最小的变量组合为最终蒙特卡洛变量组合集群分析法特征变量选取结果。2.根据权利要求1中所述基于蒙特卡洛变量组合集群的近红外光谱变量选择方法,其特征在于,步骤C中指数衰减函数变量删除的变量保留率计算公式为:-θ×Nrw=e(1)rN:指数衰减函数运行N次时变量保留率;θ:曲线控制参数,它与指数衰减函数的执行次数有关,指数衰减函数执行的次数越多,其θ值越小。N:指数衰减函数的执行次数,曲线控制参数的计算公式为:公式(2)中P为指数衰减函数执行N-1次后所保留的变量数目,L为指数衰减函数运行结束之后剩余变量数目。2CN107144548A说明书1/4页基于蒙特卡洛变量组合集群的近红外光谱变量选择方法技术领域[0001]本发明属于分析化学和光谱学领域,具体涉及基于蒙特卡洛变量组合集群的近红外光谱变量选择方法技术背景[0002]近红外的光谱频段为780nm~2500nm,光谱信息源来源于有机物的含氢基团的倍频和合频吸收,近红外光谱分析技术能够广泛的应用与物质的定性分析和定量分析领域,因此该项技术被誉为“具有提高全球农业分析能力的潜力技术”。由于近红外光谱具有上百个光谱波段,当仪器采集这些波段时除了样品自身的信息以外还包含了大量的外界信息,如噪音、样品背景干扰等。所以在分析研究中,变量选择对数据分析和建模有着及其重要的影响。进行变量选择,实际就是对变量的重要性来进行合理评价。[0003]现在,国内外主要应用的变量选择方法有蒙特卡罗无信息变量删除法(MonteCarlobasedUVE,MC-UVE,参见W-SCai,Y–KLi,X-GShao,AVariableselectionmethodbasedonuninformativevariableeliminationformultivariatecalibrationofnear-infraredspectra[J],Chemometr,Intell.Lab.Syst.2008,90,188-194)、遗传学算法(geneticalgorithm,GA,参见LeardiR,GonzalezAL,GeneticalgorithmsappliedtofeatureselectioninPLSre