预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于流亲戚关系分组的流量识别算法 一、简介 随着移动互联网的快速发展,大量的移动数据被实时产生和传输,引发了对流量识别的需求。流量识别技术是实现网络管理和安全保障的重要手段,如流量行为分析、DPI(深度数据包检测)、流量统计和流量控制等都需要流量识别技术的支持。 一些经典的流量识别算法主要基于应用或IP地址等单一特征进行分类,但往往无法有效识别流经多个节点的流量。本文提出一种基于亲戚关系分组的流量识别算法,可以识别流经多个节点的流量,从而提高了识别的准确性。 二、关键技术 2.1亲戚关系建模 亲戚关系是流量分组的本质属性之一,可以用于构建分组间的关系模型。对于亲戚关系,我们可以利用亲戚分组算法构建基于亲戚关系的分组,并用于后续的流量识别。 2.2流量特征提取 流量特征提取是流量识别算法的关键技术。我们可以利用流量的各种属性,如协议类型、应用类型、载荷大小、包大小、到达时间、发送者和接收者等特征,对流量进行特征提取,以便后续的分类和识别。 2.3基于亲戚关系的流量分类 利用构建好的亲戚分组模型,我们可以将流量分组为不同的亲戚分组,并对每个亲戚分组进行特征提取和分类。由于亲戚分组内部的流量具有较强的相似性,因此基于亲戚关系的分类方式可以提高流量识别的准确性。 三、算法设计 3.1亲戚分组算法 亲戚分组算法是基于流量亲戚关系的一种“聚类”算法。其基本思想是,为每个流量包分配一个标识,并将具有相似特征的流量包组成“亲戚群”。亲戚群内的流量包将被识别为同一亲戚分组,并将其交由基于亲戚关系的分类器进行分类。 亲戚分组算法的具体流程如下: 1)选取任意一个流量包,作为亲戚群首包; 2)将该包送入分类器中,得到其属性信息; 3)将该包的属性信息与下一个包进行比较,若相似度超过一定阈值,则将两者归为同一亲戚群,并继续向下比较; 4)若相似度未超过阈值,则将该包作为新的亲戚群首包,并重复步骤2); 5)对所有流量包进行分组后,得到多个亲戚群,将其分配给基于亲戚关系的分类器进行分类。 3.2基于亲戚关系的分类器 基于亲戚关系的分类器是针对亲戚分组内的流量包,利用其亲戚关系信息进行分类的一种分类器。其基本思想是,对于具有相似亲戚关系的流量包,应该有相似的分类结果。 基于亲戚关系的分类器的具体流程如下: 1)为每个亲戚分组分别提取流量特征; 2)将特征向量送入分类器中进行分类; 3)对于一个分类结果,将其应用于该亲戚分组内所有流量包; 4)对于多个亲戚分组,可分别采用不同的分类规则和算法进行分类。 四、实验结果 本文实验使用了公开数据集和自己抓取的数据进行测试,在分类准确率、分类速度和内存占用等方面进行了性能测试。实验结果表明,基于亲戚关系分组的流量识别算法在分类准确率上优于传统的单一特征分类算法,且具有较快的分类速度和较小的内存占用。 五、总结 本文提出了一种基于流亲戚关系分组的流量识别算法,可有效解决传统流量识别算法无法识别经过多个节点的流量的问题。该算法具有较优的分类准确率、快速的分类速度和较小的内存占用,在网络管理、流量统计和流量控制等方面具有广泛的应用前景。