预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109902881A(43)申请公布日2019.06.18(21)申请号201910210516.1(22)申请日2019.03.19(71)申请人武汉乐易创想科技有限公司地址430000湖北省武汉市武昌区和平大道1004号杨园教育科技创业园2#A座404(72)发明人方强何粤城王学锐(74)专利代理机构北京天盾知识产权代理有限公司11421代理人杨本官(51)Int.Cl.G06Q10/04(2012.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书6页附图5页(54)发明名称基于多元统计分析和LSTM融合的PM2.5浓度预测方法(57)摘要本发明涉及人工智能与大数据领域,涉及基于多元统计分析和LSTM融合的PM2.5浓度预测方法,包括在理论层面上分析两者的优缺点,并在此基础上构建基于两者的融合算法;通过从省控点、国控点获取气象数据与污染物数据;采样近半年的数据,通过使用Pearson相关系数分析各因子与PM2.5浓度的相关性;将所有数据分为训练数据、测试数据、预测数据三个部分,其中使用训练数据去训练模型,并设置相关的模型参数;将测试数据输入模型中,最终获取预测结果,本发明通过分析PM2.5的时间和空间特性,将数据进行降维,通过深度学习技术,挖掘PM2.5的深层数据特征,大大提升了数据运算的速度,结合精度的提升,使预测工作可以实时进行,消除数据滞后性问题。CN109902881ACN109902881A权利要求书1/2页1.基于多元统计分析和LSTM融合的PM2.5浓度预测方法,其特征在于,包括如下步骤:步骤一、获取源数据:从各省控点、国控点获取气象数据与污染物数据;步骤二、数据预处理:采样至少半年内的数据,计算各因子与PM2.5浓度的相关系数,将获取的数据进行排序,剔除相关系数小于0.5的因子;步骤三、数据分类训练:将所有数据分为训练数据、测试数据、预测数据三个部分,其中使用训练数据去训练LSTM模型,并设置LSTM模型参数;步骤四、评价预测模型:设定数据阈值,将测试数据输入模型中,并通过RMSE、MAP、MSE三种方法评价模型的预测结果;如果预测结果符合阈值要求进入步骤五,如果不符合就进入步骤一;步骤五、将待分析数据输入预测模型获取预测结果。2.根据权利要求1所述的基于多元统计分析和LSTM融合的PM2.5浓度预测方法,其特征在于,所述步骤三中的LSTM模型包括3个控制门,分别是输入门it、输出门ot、遗忘门ft;遗忘门ft表达式为:ft=σ(Wf*[ht-1,xt]+Bf)其中Wf为权重矩阵,Bf为偏置值,σ为sigmoid函数;输入门的Sigmoid层it计算公式是:it=σ(Wi*[ht-1,xt]+Bi)其中Wi为权重矩阵,Bf为偏置值,tanh层的候选向量Cst表达式为:Cst=tanh(Wc*[ht-1,xt]+Bc)其中Wc为权重矩阵,Bc为偏置值;tanh层的更新值表达式为:Ct=ft*Ct-1+it*Cst;输出门Ot包括sigmoid层与tanh层,所述输出门Ot运行sigmoid层决定细胞状态被输出部分,然后将tanh函数与sigmoid门的输出相乘,其计算公式为:ot=σ(Wo*[ht-1,xt]+Bo),ht=ot*tanh(Ct)。3.根据权利要求1所述的基于多元统计分析和LSTM融合的PM2.5浓度预测方法,其特征在于,所述步骤二中,相关系数具体公式如下:其中Rp为相关系数,xi为输入值,xav为均值,yi为输出值,yav为输出均值,相关性阈值为0.3。4.根据权利要求1所述的基于多元统计分析和LSTM融合的PM2.5浓度预测方法,其特征在于,所述步骤三具体包括:3.1.将经过处理的数据分为训练集、测试集、预测值,其中训练集用于训练模型;3.2.将模型所需的参数赋值,将隐藏层数量设为72个神经元,输出层仅使用1个神经元,输入变量是PM10、CO、NO2、NOx、NO、湿度、SO2的时间步特征,损失函数使用MAE,优化算法使用Adam,模型的迭代次数epochs设为72,每次迭代选取的batch大小为72。5.根据权利要求1所述的基于多元统计分析和LSTM融合的PM2.5浓度预测方法,其特征在于,所述步骤四中进行测试数据时使用的三种评价回归模型指标分别为:MSE:MAE:RMSE:其2CN109902881A权利要求书2/2页中M为总数量,yi为输出值,yav为输出均值;所述步骤四还包括:将测试数据预测的结果与实际的浓度值作对比,使用RMSE、MAP、MSE三种方法评价模型,若计算得到的结果符合阈值的要求,则停止模型,否则重新调整模型。6.根据权利要求1所述的基于多元统计