预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115718746A(43)申请公布日2023.02.28(21)申请号202210527032.1G01N33/24(2019.01)(22)申请日2022.05.16(71)申请人南开大学地址300350天津市津南区海河教育园区同砚路38号申请人农业农村部环境保护科研监测所(72)发明人李润桐穆莉胡献刚邓鹏(74)专利代理机构北京智桥联合知识产权代理事务所(普通合伙)11560专利代理师程小艳(51)Int.Cl.G06F16/22(2019.01)G06F16/215(2019.01)G06F16/2458(2006.01)G06F18/214(2023.01)权利要求书2页说明书5页附图2页(54)发明名称基于机器学习的稻田甲烷排放量预测方法(57)摘要本发明公开了基于机器学习的稻田甲烷排放量预测方法,包括建立稻田甲烷排放数据库,数据预处理,使用随机森林、支持向量机、XGBoost、神经网络算法将处理后的数据集输入模型进行训练,并分别调节这四种模型的超参数使其达到准确度要求,得到预测稻田甲烷排放的机器学习模型,根据调参结束的模型进行10折交叉验证,得到模型的预测结果,在所有数据上拟合模型,得到最终模型。本发明基于机器学习的稻田甲烷排放量预测的方法可以快速、准确地对稻田甲烷排放量进行预测,为快速预测甲烷排放量提供了技术基础。CN115718746ACN115718746A权利要求书1/2页1.基于机器学习的稻田甲烷排放量预测方法,其特征在于,包括如下步骤:步骤S1:建立稻田甲烷排放数据库;步骤S2:数据预处理,具体步骤包括:S2.1划分训练集和测试集;根据实验持续时间进行分层抽样;S2.2数值属性的标准化,对数值数据进行标准化来特征缩放,使得数据均值为0且分布具有单位方差;进行标准化的属性包括:实验持续时间、经度、纬度、年平均温度、平均年降水量、土壤容重、粘粒含量、土壤总氮、土壤有机碳、土壤C/N、土壤pH、生物炭施用、粪肥施用、绿肥施用、无机氮施用量共15个数值属性;标准化公式如下:其中,x为原数值,x′为标准化后的数值属性,μ为数值属性的均值,σ为标准差;S2.3分类属性数字化,要作为机器算法的输入,需要对分类属性进行数字化,使用one‑hot编码为每个类别创建一个二进制的属性,具体使用Scikit‑Learn的OneHotEncoder编码器来实现;进行one‑hot编码的属性包括轮作方式、是否耕作、秸秆还田方式、灌溉方式共4个分类属性;步骤S3:使用随机森林、支持向量机、XGBoost、神经网络算法将处理后的数据集输入模型进行训练,并分别调节这四种模型的超参数使其达到准确度要求,得到预测稻田甲烷排放的机器学习模型;所述步骤S3具体步骤包括:S3.1使用Scikit‑Learn训练随机森林、支持向量机、XGBoost,使用Keras训练两层全连接神经网络;S3.2网格搜索法在训练集上选择模型超参数,10折交叉验证评估需要进行实验的超参数值的所有组合,根据验证集上的分数得到最佳估算器,然后在整个训练集上重新训练;S3.3在测试集上评估模型作为泛化误差的近似,首先使用训练集得到的转换数据的方法对转换测试集的数据,然后评估模型在测试集上的性能,评估指标包括相关系数R2和均方根误差RMSE;2R=ρX,Y其中,X表示实际值,Y表示预测值;步骤S4:根据调参结束的模型进行10折交叉验证,得到模型的预测结果;步骤S5:在所有数据上拟合模型,得到最终模型。2.根据权利要求1所述的基于机器学习的稻田甲烷排放量预测方法,其特征在于,所述步骤S1具体步骤包括:步骤S1.1从数据库中收集文献:收集的数据来源于WebofSciences数据库中发表的文献,使用“methaneORCH4”AND“rice*ORpaddy*ORcornfield”检索,并按照以下标准进行筛选:(1)田间试验;排除在花盆、实验室、温室中进行的培养测量以及模型模拟计算的通量;2CN115718746A权利要求书2/2页(2)研究提供了季节排放通量并排除了未提供施氮量的研究;(3)排除了使用钢渣、矿渣、硅酸盐、粉煤灰等土壤改良剂进行的实验以及稻蟹养殖、稻鱼养殖系统;步骤S1.2记录文献中变量,包括:实验持续时间、实验地点、经度、纬度、年平均温度、平均年降水量、土壤容重、粘粒含量、土壤总氮、土壤有机碳、土壤C/N、土壤pH、生物炭施用、粪肥施用、绿肥施用、无机氮施用量、轮作方式、是否耕作、秸秆还田方式、灌溉方式、水稻甲烷季节排放通量;步骤S1.3文章以文字或表格形式提供的变量手动抄录,以图的形式提供的数据使用Origin提供的“Digitizer”工具读取;步骤S1.4对于论文中未提供的土壤性质、气候数