预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114968706A(43)申请公布日2022.08.30(21)申请号202210491096.0(22)申请日2022.05.07(71)申请人河海大学地址210024江苏省南京市鼓楼区西康路1号(72)发明人傅质馨刘铨麟朱俊澎袁越(74)专利代理机构南京苏高专利商标事务所(普通合伙)32204专利代理师向文(51)Int.Cl.G06F11/30(2006.01)G06F16/215(2019.01)G06N3/00(2006.01)G06Q50/06(2012.01)权利要求书2页说明书8页附图2页(54)发明名称基于改进孤立森林算法的水电站数据异常检测方法(57)摘要本发明公开了一种基于改进孤立森林算法的智能化水电站异常数据检测方法,包括:结合差分进化算法对孤立森林算法进行改进,实现孤立森林的自动化调参;根据孤立森林算法中森林的构建与树的生长方式,设计目标函数;通过限定进化梯度避免过优化,确定合适的进化迭代次数;综合模型给出的最优超参数解对智能化水电站机组运行数据进行异常检测,获得最终的异常检测结果。本发明适用于智能化水电站的所有缓变量数据异常检测,差分进化的优化结果提高了水电站数据异常检测的准确度,同时,通过限制进化迭代,避免了过优化带来额外的工作量,能够实现对智能化水电站运行数据中的异常准确检测。CN114968706ACN114968706A权利要求书1/2页1.一种基于改进孤立森林算法的水电站数据异常检测方法,其特征在于,包括如下步骤:S1:基于差分进化算法,对孤立森拉算法进行改进;S2:根据孤立森林的建立与树的生长方式设计目标函数;S3:通过限制合适的进化梯度避免过优化,确定进化的迭代次数;S4:使用训练好的改进孤立森林算法对水电站数据进行异常检测,获得最终的异常检测结果。2.根据权利要求1所述的一种基于改进孤立森林算法的水电站数据异常检测方法,其特征在于,所述步骤S1中对孤立森拉算法的改进包括如下步骤:A1:根据经验生成孤立森林的超参数初始解,即初始种群,在解空间中随机均匀产生M个个体,每个个体由n维向量组成,如下式表达:Xi(0)=(xi,1(0),xi,2(0),xi,3(0),…,xi,n(0))(1)式中,i=1,2,3,…,M,第i个个体的第j维值取值方式如下:Xi,j=Lj_min+rand(0,1)·(Lj_max‑Lj_min)(2)式中,i=1,2,3,…,M;j=1,2,3,…n;A2:对基向量差分变异:将一个可缩放且随机选择的向量差分量加到基向量中,在第g次迭代中,从种群中随机选择3个个体Xp1(g),Xp2(g),Xp3(g)且p1≠p2≠p3≠i,同时得到其对应的适应度f,生成的变异向量为:Vi(g)=Xp1(g)+F·(Xp2(g)‑Xp3(g))(3)式中,(Xp2(g)‑Xp3(g))是差分向量,F是缩放因子,当进化策略不同时该步骤所产生的变异向量的方式也不一样,A3:对基向量与变异向量重组:产生重组个体的公式如下:式中,cr∈[0,1]为交叉概率,hi,j(g)表示变异后的个体,xi,j(g)表示原始个体;A4:对重组后的实验个体进行选择,选择公式如下:当重组个体的适应度更高时,该个体得以保留至下一代种群;A5:重复上述步骤直到满足进化终止条件,输出最优的孤立森林超参数解,基于此构建孤立森林。3.根据权利要求2所述的一种基于改进孤立森林算法的水电站数据异常检测方法,其特征在于,所述步骤A2中选用current‑to‑best算法模板,其具体进化策略如下:Vi(g)=Xp1(g)+F·(Xbest(g)‑Xi(g))+F·(Xp2(g)‑Xp3(g))(4)式中,Xbest为当前最优个体。4.根据权利要求1所述的一种基于改进孤立森林算法的水电站数据异常检测方法,其2CN114968706A权利要求书2/2页特征在于,所述步骤S2中目标函数的设计方法为:构建目标函数的数学模型:已知待检测的水电站数据集中样本总数为x,假设树的个数为n,每棵树抽取的样本量为m,且x小于m·n,也就是总共抽取的样本数量;定义随机变量xi如下:xi独立同分布,此时可得对于第i个样本未被抽取的概率如下:结合xi独立同分布,所以此时未被某棵树抽取到水电站数据的个数的数学期望如下:获得所需的目标函数,也就是水电站运行数据集中未被任一孤立树抽取的样本数量函数,其因变量为孤立森林中孤立树的个数与每棵树上抽取的样本数。5.根据权利要求1所述的一种基于改进孤立森林算法的水电站数据异常检测方法,其特征在于,所述步骤S3中通过限制合适的进化梯度避免过优化,确定进化的迭代次数的方法为:根据差分进化算法与水电站运行数据特征,设置进化停止梯度k,当下一次迭代进