预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115757778A(43)申请公布日2023.03.07(21)申请号202211425540.5(22)申请日2022.11.15(71)申请人中国建设银行股份有限公司地址100033北京市西城区金融大街25号(72)发明人赵辉刘爱辉(74)专利代理机构北京集佳知识产权代理有限公司11227专利代理师黄水娜(51)Int.Cl.G06F16/35(2019.01)G06F18/2413(2023.01)G06F40/284(2020.01)G06F18/22(2023.01)权利要求书3页说明书9页附图3页(54)发明名称一种告警文本的处理方法及装置(57)摘要本发明提供一种告警文本的处理方法及装置,提取待分类告警文本中的各个特征词;基于各个特征词构建第一复杂网络;将第一复杂网络中的特征词映射为维基百科中的同义词,得到第二复杂网络;计算第二复杂网络与每一第三复杂网络之间的相似度,得到与多个历史告警文本对应的相似度;计算每一故障类别下的相似度的累加值,选取最大的累加值对应的故障类别作为待分类告警文本的故障类别。在本方案中,基于待分类告警文本建立复杂网络,并与基于历史告警文本建立的复杂网络进行比较,以复杂网络之间的相似度反映告警文本之间的相似度,并利用KNN分类算法基于相似度,确定待分类告警文本的故障类别,从而实现对待分类告警文本故障类别判断,定位故障原因。CN115757778ACN115757778A权利要求书1/3页1.一种告警文本的处理方法,其特征在于,包括:获取待分类告警文本;提取所述待分类告警文本中的各个特征词;以各个特征词为节点,按照预设规则连接相应的节点,构建第一复杂网络;将所述第一复杂网络中的特征词映射为维基百科知识库中的同义词,得到第二复杂网络;计算所述第二复杂网络与每一预先构建的第三复杂网络之间的相似度,得到与多个历史告警文本对应的相似度;每一所述第三复杂网络预先基于已标注故障类别的历史告警文本构建;利用KNN算法,计算每一故障类别下的历史告警文本对应的相似度的累加值,选取最大的累加值对应的故障类别作为所述待分类告警文本的故障类别。2.根据权利要求1所述的方法,其特征在于,所述以各个特征词为节点,按照预设规则连接相应的节点,构建第一复杂网络,包括:将各个特征词作为节点;若任意两个节点对应的特征词在所述待分类告警文本中间隔的字符数小于或等于m,则将所述任意两个节点连接,构成连接边;其中,m为正整数;根据预设的权重公式计算并设置各个连接边的权重;由各个节点和各个设置了权重的连接边构成第一复杂网络。3.根据权利要求1所述的方法,其特征在于,所述计算所述第二复杂网络与每一预先构建的第三复杂网络之间的相似度,得到与多个历史告警文本对应的相似度,包括:提取每一预先构建的所述第三复杂网络和所述第二复杂网络之间最大重叠部分,得到各个第四复杂网络;基于预设的相似度公式和各个所述第四复杂网络,计算得到所述第二复杂网络与各个预先构建的第三复杂网络之间的相似度,得到与多个历史告警文本对应的相似度。4.根据权利要求3所述的方法,其特征在于,所述提取每一预先构建的所述第三复杂网络和所述第二复杂网络之间最大重叠部分,得到各个第四复杂网络,包括:遍历每一预先构建的所述第三复杂网络和所述第二复杂网络中的节点,提取每一所述第三复杂网络与所述第二复杂网络之间的各个公共节点;针对每一所述第三复杂网络与所述第二复杂网络之间的各个公共节点,若任意两个公共节点在所述第三复杂网络和所述第二复杂网络中都有与之连接的连接边,则将所述任意两个公共节点连接,构成公共连接边,并将各个所述连接边的权重中的最小值作为所述公共连接边的权重;由每一所述第三复杂网络与所述第二复杂网络之间的各个公共节点和所述各个公共节点之间的公共连接边,构成各个第四复杂网络。5.根据权利要求1所述的方法,其特征在于,所述利用KNN算法,计算每一故障类别下的历史告警文本对应的相似度的累加值,选取最大的累加值对应的故障类别作为所述待分类告警文本的故障类别的过程,包括:将各个历史告警文本基于所述相似度由大到小进行排序;基于所述排序的次序,依次筛选出预设个数的目标历史告警文本;2CN115757778A权利要求书2/3页基于各个目标历史告警文本预先标注的故障类别,计算每一故障类别下的目标历史告警文本对应的相似度的累加值,得到各个故障类别对应的相似度累加值;选取最大的累加值对应的故障类别作为所述待分类告警文本的故障类别。6.一种告警文本的处理装置,其特征在于,包括:获取单元,用于获取待分类告警文本;提取单元,用于提取所述待分类告警文本中的各个特征词;构建单元,用于以各个特征词为节点,按照预设规则连接相应的节点,构建第一复杂网络;映射单元