预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113722607A(43)申请公布日2021.11.30(21)申请号202110712405.8(22)申请日2021.06.25(71)申请人河海大学地址211100江苏省南京市江宁区佛城西路8号(72)发明人徐颖韩立新(74)专利代理机构北京中政联科专利代理事务所(普通合伙)11489代理人何磊(51)Int.Cl.G06F16/9536(2019.01)G06K9/62(2006.01)H04L29/06(2006.01)权利要求书1页说明书6页附图1页(54)发明名称一种基于改进聚类的托攻击检测方法(57)摘要本文发明公开了一种基于改进聚类的托攻击检测方法,包括以下步骤:a)混合概貌数据集;b)构建用户深层相似度矩阵;c)混合数据集聚类分析;d)获取共同关注项;e)过滤共同关注项;f)特征指标提取与压缩。本发明能够深度挖掘用户特征信息,利用改进聚类的方法实现用户分类,通过过滤共同关注项,消减流行项目评分对特征指标提取的影响,对特征指标进行二次提取与压缩,突出类间可分性,保证攻击概貌与普通概貌集合于空间地两端,最终达到识别攻击概貌的效果。CN113722607ACN113722607A权利要求书1/1页1.一种基于改进聚类的托攻击检测方法,包括以下步骤:a、混合概貌数据集,将攻击概貌数据集以及普通用户概貌数据集集合到同一数据集中;b、构建用户深层相似度矩阵,针对已有的用户相似度矩阵难以提取更深层用户隐式特征信息的缺点,现提出一种用户深层相似度矩阵构建的方法;c、混合数据集聚类分析,对该混入攻击概貌的数据集进行聚类分析,根据步骤b中获取的用户深层相似度矩阵,确定聚类中心K的个数,并初始化聚类中心,通过Pearson相关系数定义距离度量和分类决策规则;d、获取共同关注项,根据步骤c中获取到的簇集,在同一簇集中根据评分次数获取不同用户的共同关注项;e、过滤共同关注项,为了防止流行项目的干扰,先根据步骤c和步骤d相似地获取普通用户概貌的共同关注项,在此基础上,对于步骤d中所获得的共同关注项进行过滤操作,在推荐系统中,由于每个用户的最近邻不是完全相同,这也就导致它们所需要过滤的共同关注项也是不尽相同的,所以在过滤前就需要先将每个进入推荐系统的普通用户使用改进聚类划分到不同的簇集中,最终再过滤普通用户概貌的共同关注项项;f、特征指标提取与压缩,采用类内散布矩阵的单类模式特征提取方法对特征指标二次提取与压缩,实现攻击概貌与普通概貌的分类。2.如权利要求1所述的一种基于改进聚类的托攻击检测方法,其特征在于,步骤b中所述构建用户深层相似度矩阵。3.如权利要求1所述的一种基于改进聚类的托攻击检测方法,其特征在于,步骤c中所述混合数据集聚类分析,其中聚类中心K的个数和初始聚类中心的选定对于最终K‑Means算法的聚类效果具有很重要的影响。4.如权利要求1所述的一种基于改进聚类的托攻击检测方法,其特征在于,步骤d中所述在同一簇集中根据评分次数获取不同用户的共同关注项,每个簇集都有其区别于其他簇集的共同关注项,但是这些共同关注项都会可能成为近邻用户关注的项目,对于协同过滤推荐系统来说,近邻用户是进行定向推荐的基础,用来计算预测值,一般情况,近邻个数的提高能够有效保障推荐的准确性,但是这确是以计算效率作为代价,所以选择合适的近邻个数,能够最大的帮助分析数据集中的概貌差异。5.如权利要求1所述的一种基于改进聚类的托攻击检测方法,其特征在于,步骤e中所述过滤步骤d所取得的共同关注项方法。6.如权利要求1所述的一种基于改进聚类的托攻击检测方法,其特征在于,步骤f中对特征指标二次提取与压缩,实现攻击概貌与普通概貌的分类。2CN113722607A说明书1/6页一种基于改进聚类的托攻击检测方法技术领域[0001]本发明属于推荐系统安全和机器学习领域,具体涉及一种基于改进聚类的托攻击检测方法。背景技术[0002]协同过滤推荐是目前各大运营公司的主要运用的推荐技术,通过分析系统用户的各种行为操作,帮助其找到对口信息,在一定程度上极大地促进了网上交易量的增加,社会经济的发展,也使得“信息爆炸”现象得到缓解。[0003]但这同时也引起了一些不法分子的关注,攻击者通过虚假用户恶意篡改推荐系统评分,从中获利。托攻击就是攻击者利用协同过滤具有开放性的特点使得线上信任关系岌岌可危。[0004]因此,为了最大程度上解决这个问题,研究人员提出了多种托攻击检测方法,但随着攻击手段提高,用户评分数据集显得极为关键,因此如何提取出数据集中的用户隐式特征信息,设计出一种更加准确检测出攻击概貌的方法变得至关重要。发明内容[0005]发明目的:本发明针对现有技术在用户评分数据集中利用程度不高,无法提取深层用户