预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115983334A(43)申请公布日2023.04.18(21)申请号202211628717.1(22)申请日2022.12.18(71)申请人南京理工大学地址210094江苏省南京市玄武区孝陵卫200号(72)发明人俞研王增狄芳徐建(74)专利代理机构南京理工大学专利中心32203专利代理师马鲁晋(51)Int.Cl.G06N3/045(2023.01)G06N3/0475(2023.01)G06N3/0442(2023.01)G06N3/094(2023.01)G06F18/214(2023.01)权利要求书3页说明书9页附图2页(54)发明名称一种基于生成对抗网络的网络流量生成方法(57)摘要本发明公开了一种基于生成对抗网络的网络流量生成方法。该方法为:对数据集进行预处理,包括属性特征评估、文本转化为数值、缺失值处理、特征数据归一化;设计面向网络流量生成的生成对抗网络模型架构,包括生成器模块、鉴别器模块和网络奖励机制;接着训练网络模型,分为模型预训练和正式训练两个阶段;对生成的流量数据进行数据评估和筛选,包括质量评估、相似性评估和标记评估,筛选合格样本形成标记流量集。本发明使用WGAN‑GP来设计模型,并结合LSTM进一步学习网络流量序列的时间特性,使得生成的网络流量数据在分类标记、真实性以及成功率方面均得到提升,能够为基于机器学习的网络入侵检测模型训练提供大批量、高质量标记数据。CN115983334ACN115983334A权利要求书1/3页1.一种基于生成对抗网络的网络流量生成方法,其特征在于,包括以下步骤:步骤1、对数据集进行预处理,包括属性特征评估、文本转化为数值、缺失值处理、特征数据归一化;步骤2、设计面向网络流量生成的生成对抗网络模型架构,包括生成器模块、鉴别器模块和网络奖励机制;步骤3、训练网络模型,分为模型预训练和正式训练两个阶段;步骤4、对生成的流量数据进行数据评估和筛选,包括质量评估、相似性评估和标记评估,筛选合格样本形成标记流量集。2.根据权利要求1所述的基于生成对抗网络的网络流量生成方法,其特征在于,步骤1所述的对数据集进行预处理,包括属性特征评估、文本转化为数值、缺失值处理、特征数据归一化,具体为:使用当前公开可用的数据集和真实网络流量进行预处理,包括流量数据的属性特征评估、文本转化为数值、缺失值处理和特征数据归一化。3.根据权利要求2所述的基于生成对抗网络的网络流量生成方法,其特征在于,步骤1所述的对数据集进行预处理,包括属性特征评估、文本转化为数值、缺失值处理、特征数据归一化,步骤如下:步骤1.1、属性特征评估:使用公开流量数据集和真实网络流量进行流量数据生成实验,数据集一包含超过200万个具有49个属性的网络流和9种攻击类别,数据集二包含超过280万个具有80个特征的网络流量,首先剔除时间戳不适合机器学习的属性列,设置dataset_features字典;步骤1.2、将文本转化为数值,将源文件中的攻击类型转换成数字标识;步骤1.3、删除源数据中缺失值所在的行;步骤1.4、对特征数据进行归一化处理。4.根据权利要求1所述的基于生成对抗网络的网络流量生成方法,其特征在于,步骤2所述的设计面向网络流量生成的生成对抗网络模型架构,包括生成器模块、鉴别器模块和网络奖励机制,具体为:生成对抗网络GAN包括生成器模块和鉴别器模块,通过两个神经网络的不断博弈学习,从而生成鉴别器难以区分的合成数据;方法模型使用带梯度惩罚的WassersteinGAN,即WGAN‑GP,结合长短期记忆网络LSTM捕获网络流量序列中的时间相关性,分别设计生成器和鉴别器,并使用网络奖励机制提高生成质量。5.根据权利要求4所述的基于生成对抗网络的网络流量生成方法,其特征在于,步骤2所述的设计面向网络流量生成的生成对抗网络模型架构,包括生成器模块、鉴别器模块和网络奖励机制,步骤如下:步骤2.1、网络模型使用生成对抗网络的一种变体—带梯度惩罚的WassersteinGAN,即WGAN‑GP,与经典生成对抗网络相比,WGAN从损失函数的角度进行了改进;通过计算Wasserstein距离来衡量数据分布和真实数据分布之间的距离,公式如下:2CN115983334A权利要求书2/3页其中inf指代最大下界;π(P1,P2)表示的是分布P1和P2中所有可能的联合分布,每一个联合分布用于刻画连续空间中分布间转换的代价,即刻画从x点转移到y点从而让x,y服从相同分布所需要的百分比;步骤2.2、修改原始生成对抗网络的目标函数,在WGAN基础上改进Lipschitz连续性限制条件,将权重修剪策略改为梯度约束的方式,从而提高模型建模能力,解决梯度消失或梯度爆炸问题;改进后W生成对抗网络