预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109995772A(43)申请公布日2019.07.09(21)申请号201910215830.9(22)申请日2019.03.21(71)申请人长春理工大学地址130022吉林省长春市朝阳区卫星路7089号(72)发明人任维武底晓强李锦青毕琳解男男(74)专利代理机构长春众邦菁华知识产权代理有限公司22214代理人王丹阳(51)Int.Cl.H04L29/06(2006.01)G06K9/62(2006.01)权利要求书2页说明书3页附图1页(54)发明名称一种基于CFSFDP聚类的并行自适应异常检测方法(57)摘要一种基于CFSFDP聚类的并行自适应异常检测方法,涉及网络信息安全领域,解决现有基于CFSFDP聚类异常检测方法的时效性和实时性问题,本发明所述的检测方法将标记的原有中心点的聚类的核心区和边缘区分开处理,实现了轮廓的动态更新,使得基于CFSFDP的异常检测方法具有更高的时效性。本发明将原有数据点与实时输入的新数据点的距离计算平分成多份,多个进程并行计算,减少了计算时间,加快了聚类轮廓生成的速度,提高了基于CFSFDP异常检测方法的实时性。CN109995772ACN109995772A权利要求书1/2页1.一种基于CFSFDP聚类的并行自适应异常检测方法,其特征是,该方法由以下步骤实现:步骤一、输入网络数据点,并在所述输入的网络数据点中分别标注原有中心点Ccl,属于聚类但在原有中心点半径d外的点Ecl以及离散点D;删除原有中心点半径d内除了中心点Ccl外的所有点;C为中心点标识,cl为聚类标识,E为边缘点标识;步骤二、实时输入新的网络数据点,并行计算新加入的数据点与步骤一中的网络数据点的距离;具体过程为:计算新加入的数据点i到原有中心点Ccl的距离DT(i,Ccl),其降序序列为DSC;新加入的数据点i到属于聚类但在原有中心点半径d外的点Ecl的距离DT(i,Ecl),其降序序列为DSE;新加入点i到离散点D的距离DT(i,D),离散点的降序序列为DSD,其中DS为降序序列标识;步骤三、判断新加入的数据点i是否在原有中心点半径d内,如果是,则原有中心点半径d内数据点的密度值加1;如果否,执行步骤四;步骤四、检索降序序列DSE和离散点的降序序列DSD,生成所述新加入的数据点i的半径内数据点密度值ρ和新加入的数据点i到原有中心点距离DT(i,Ccl),根据所述密度值ρ和新加入的数据点i到原有中心点Ccl的距离DT(i,Ccl)生成新加入的数据点i选择因子序列DSr;生成新加入的数据点i选择因子γi的计算公式为:式中,ρi为i点的密度值,DTmin为到原有中心点距离DT(i,Ccl)中的最小距离,DTmax为到原有中心点距离DT(i,Ccl)中的最大距离,θ是选择系数,默认值为1;步骤五、判断新加入的数据点i是否为新的中心点,如果否,则执行步骤六,如果是,执行步骤七;步骤六、判定新加入的数据点i是否为离散点,如果是离散点,加入离散点序列,标注为D;如果不是离散点,则判定新加入的数据点i属于哪个聚类,检索DSC序列的末尾,即距离该DSC序列的末尾最近的聚类为新加入的数据点i属于的聚类,找到新加入的数据点i的中心点及聚类信息;步骤七、扩大新的中心点的半径至边界,搜索新的中心点的半径外距离所述新的中心点最近点j,扩大中心点半径至最近点j,标注扩大后半径内所有点为cl,标注最近点j半径内所有的点为Nj,其中N为最近点标识;执行步骤八;步骤八、判断是否存在属于最近点j半径内的点但不属于新的中心点扩大半径后半径内的点,如果存在,则继续扩大半径;如果不存在,停止扩大,保留密度ρ的值,删除新的中心点扩大半径后内的所有点。2.根据权利要求1所述的一种基于CFSFDP聚类的并行自适应异常检测方法,其特征在于:判断新加入的数据点i是否为新的中心点时,根据步骤四中选择因子γi的阶跃度来判定,当阶跃度为1时,即为新的中心点,阶跃度的计算方式为:STC=Sgn(γi-γi-1-κC)式中,Sgn为单位阶跃函数,κC为中心点阶跃因子,γi-1是选择因子序列DSr中γi的前一个因子。2CN109995772A权利要求书2/2页3.根据权利要求1所述的一种基于CFSFDP聚类的并行自适应异常检测方法,其特征在于:步骤六中,新加入的数据点i如果是离散点,离散点的选择因子值存在一个明显阶跃,即它的值小于其他聚类点的值,当阶跃度为1时,即为离散点,阶跃度的计算方式为:STD=Sgn(γi-γi-1-κD)其中Sgn为单位阶跃函数,κD为离散点阶跃因子。4.根据权利要求1所述的一种基于CFSFDP聚类的并行自适应异常检测方法,其特征在于:所述聚类信息为聚类标识,中心点标识以及边缘点