预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114169520A(43)申请公布日2022.03.11(21)申请号202111326449.3G06F16/909(2019.01)(22)申请日2021.11.10G06F16/215(2019.01)(71)申请人安徽农业大学地址230036安徽省合肥市蜀山区长江西路130号安徽农业大学资源与环境学院(72)发明人李军利周成邢文文王伟印渠鸿娇(74)专利代理机构南京君陶专利商标代理有限公司32215代理人狄荣君(51)Int.Cl.G06N5/00(2006.01)G06N20/20(2019.01)G06K9/62(2022.01)权利要求书2页说明书6页附图4页(54)发明名称一种时空梯度提升决策树的方法(57)摘要本发明公开了一种时空梯度提升决策树的方法,包括步骤一、目标数据获取,对原始数据进行筛选,得到目标地区气象站点的数据;步骤二、使用Python对数据中不需要的特征数据以及对剩余数据中的噪声数据进行线性处理,提高数据完整性;步骤三、对处理后的气象数据进行计算,将每日数据转为需要的月平均数据;步骤四、根据站点的时间属性信息和空间属性信息获得时空信息;步骤五、利用气象站点的纬度,月平均气温和月平均降水计算月SPEI数据;步骤六、ST‑GBDT模型构建与预测。该时空梯度提升决策树的方法,能够利用时空信息与GBDT相结合的方式,在输入探索变量中增加时空信息,增加输入变量的特征,利用scikit‑learn的类库在Python语言中的开发实现。CN114169520ACN114169520A权利要求书1/2页1.一种时空梯度提升决策树的方法,其特征在于以标准化降水蒸散发指数的SPEI预测方式分为,包括以下步骤:步骤一、目标数据获取,对原始数据进行筛选,得到目标地区气象站点的数据;步骤二、使用Python对数据中不需要的特征数据以及对剩余数据中的噪声数据进行线性处理,提高数据完整性;步骤三、对处理后的气象数据进行计算,将每日数据转为需要的月平均数据;步骤四、根据站点的时间属性信息和空间属性信息获得时空信息;步骤五、利用气象站点的纬度,月平均气温和月平均降水计算月SPEI数据;步骤六、ST‑GBDT模型构建与预测,将获取到的站点的时间属性信息和空间属性信息融入ST‑GBDT模型,开展模型构建与预测。2.根据权利要求1所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤一中,先对目标地区中的站点进行提取,使用Python的pandas库对中国地面气候资料日值数据集进行筛选,通过站点号这一特征值筛选出相应的数据。3.根据权利要求1所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤二中,中国地面气候资料日值数据集中的多项气象数据无需使用,SPEI值通过气温与降水和纬度三项特征值计算,将除气温和降水以外其他气象特征进行删除,保留气温与降水两项气象数据,数据中包含有噪声数据,是由于缺乏观测任务等原因产生,通过使用Python中的pandas库对噪声数据进行线性处理。4.根据权利要求1所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤三中,通过Python的pandas库将数据集中的日期数据转化为dataframe数据,再对数据进行月平均数值的计算。5.根据权利要求1所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤四中,对于给定站点,其空间(Ds)和时间(Dt)特征可以表示为如下公式:所述ds和dt表示时空距离,M和N分别表示站点附近的m个站点以及同一站点的前n月。6.根据权利要求1所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤五通过Python中的ClimateIndices库对给定站点的月平均气象数据和纬度数据进行计算,获得SPEI数据,之后对结果中的异常值进行处理,所述步骤六中,所提出的预测方法的总体流程包括以下步骤:A、数据预处理;B、ST‑GBDT模型构建;C、ST‑GBDT模型预测;2CN114169520A权利要求书2/2页D、验证与分析。7.根据权利要求6所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤A中,对步骤三、步骤四、步骤五的数据通过以下公式进行结合处理,将时间特征、空间特征、纬度、气温和降水作为变量对SPEI进行预测,结合方式为SPEI=f(lat,pre,tas,Ds,Dt),其中lat代表站点的纬度,pre代表月降水平均值,tas代表月气温平均值,Ds表示空间特征,Dt表示时间特征,f为通过ST‑GBDT模型训练获得的函数。8.根据权利要求6所述的一种时空梯度提升决策树的方法,其特征在于:所述步骤B中,所述GBDT由多棵决策树组成,所有决策树的输出累加之后便是GBDT的输出,所述GB