预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106156029A(43)申请公布日2016.11.23(21)申请号201510130968.0(22)申请日2015.03.24(71)申请人中国人民解放军国防科学技术大学地址410073湖南省长沙市开福区砚瓦池正街47号(72)发明人李虎贾焰韩伟红李树栋李爱平周斌杨树强黄九鸣全拥邓璐朱伟辉傅翔(74)专利代理机构长沙市标致专利代理事务所(普通合伙)43218代理人高建华(51)Int.Cl.G06F17/30(2006.01)G06N3/08(2006.01)权利要求书1页说明书9页附图2页(54)发明名称基于集成学习的多标签不平衡虚拟资产数据分类方法(57)摘要本发明公开了一种基于集成学习的多标签不平衡虚拟资产数据分类方法,包括以下步骤:在虚拟资产的分布式存储框架下,首先对虚拟资产数据进行有放回的随机抽样,之后,采用前馈神经网络对多标签数据进行学习,将标签之间的关联性隐含在训练好的神经网络连接权重中;与此同时,根据抽样数据中标签的分布情况选择使用SMOTE进行采样;最后,为提升分类器的泛化性能,采用集成学习法,将神经网络作为每一轮学习过程中的弱分类器;与现有技术相比,本发明以集成学习中的经典算法Bagging为框架,根据不平衡虚拟资产数据的特点,将前馈神经网络和SMOTE采样技术融合到集成学习框架中,可有效提高分类的精度。CN106156029ACN106156029A权利要求书1/1页1.一种基于集成学习的多标签不平衡虚拟资产数据分类方法,其特征在于,包括以下步骤:虚拟资产数据存储架构的描述和多标签不平衡虚拟资产数据的处理和分类器的构建;其中多标签不平衡虚拟资产数据的处理和分类器的构建步骤包括:采用神经网络进行训练学习,并结合集成学习法,将神经网络作为每一轮学习过程中的弱分类器;与此同时,在集成学习的每一轮根据不同类别数据之间的不平衡比对数据进行采样。2.根据权利要求1所述的基于集成学习的多标签不平衡虚拟资产数据分类方法,其特征在于,所述的多标签不平衡虚拟资产数据的处理和分类器的构建步骤包括:步骤一、前馈神经网络;步骤二、SMOTE采样法;步骤三、多标签不平衡数据集成学习。3.根据权利要求2所述的分类器构建,在所述的多标签不平衡数据集成学习步骤中,其特征在于,包括以下步骤:1)给定训练样本集合S后,通过多次随机放回采样后,每次从训练样本集合中抽取得到一个样本组成一个训练子集S’;2)统计训练子集中各标签的出现频率,依次计算各标签频率和最大频率之间的比值:如果该比值超过标签频率之间的最小比例阈值,则对包含各标签的样本进行过采样;如果某标签的出现频率为1,即包含该标签的样本数为1,则使用简单复制策略,得到复制集合;如果出现频率大于1,则采用SMOTE法对包含该标签的样本进行采样,得到采样集合S′;最终将原始训练样本和复制及采样得到的数据进行合并,得到一个类别标签近似平衡的训练子集S”;3)对集合S”按下述所示的公式进行归一化处理,然后在归一化后的数据集上训练前馈神经网络;*”其中xi为子集S”的第i个样本归一化处理后样本,xi”为子集S”的第i个样本;min,max分别为该子集中样本的最大值和最小值;4)重复步骤1)至步骤3),得出训练后的神经网络模型;5)将所有测试样本分别输入到步骤4)所得神经网络模型中,统计其输出结果,得到输出矩阵;6)建立初始化结果标签集合,该标签集合为空,按行遍历输出矩阵,通过多数投票原则,即将所有分类器的输出结果加起来,如果结果超过一半,则将标签添加到标签集合中,否则不进行添加,遍历完整个后矩阵得出最终样本的类别标签集合。2CN106156029A说明书1/9页基于集成学习的多标签不平衡虚拟资产数据分类方法技术领域[0001]本技术属于网络与信息安全领域,涉及一种基于集成学习的多标签不平衡虚拟资产数据分类方法。背景技术[0002]互联网的迅猛发展为虚拟资产的产生及交易提供了广阔的平台,促进了网络交易的繁荣发展。但无论对于用户还是虚拟资产交易的提供商,都面临虚拟资产数据(包括虚拟资产商品信息、相关的虚拟资产交易数据以及虚拟资产操作日志等)庞杂的问题。对这些虚拟资产数据进行分类,可以帮助人们更好的管理并有效提高虚拟资产的使用效率。[0003]目前,我国已经开展了基于eID的网域空间虚拟资产管理与保全技术研究,实现对虚拟资产的规范统一管理。虚拟资产保全系统全面准确的记录了对虚拟资产商品本身以及与其相关的各种操作数据,但这些数据一方面种类多样,不同虚拟资产本身的信息各异,用户的操作行为模式更是千差万别,对这些虚拟资产数据进行分类面临诸多难题。此外,不同类别之间的虚拟资产数据量差别较大,如异常交易数据通常大大少于正常交易数据