预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114281939A(43)申请公布日2022.04.05(21)申请号202111419915.2(22)申请日2021.11.26(71)申请人中国联合网络通信集团有限公司地址100033北京市西城区金融大街21号(72)发明人秦悦李明亮吴天昊庄孺义(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人杨泽臧建明(51)Int.Cl.G06F16/33(2019.01)G06F16/35(2019.01)G06F40/216(2020.01)G06F40/289(2020.01)G06K9/62(2022.01)权利要求书2页说明书11页附图3页(54)发明名称文本分类模型的训练方法、文本分类方法、装置和设备(57)摘要本申请提供一种文本分类模型的训练方法、文本分类方法、装置和设备,该方法包括:获取多条浏览器的历史弹窗内的文本信息;对每个文本信息进行分词处理,根据分词结果确定出每个文本信息对应的第一特征向量;对第一特征向量进行聚类,得到至少一个文本信息组;从每个文本信息组中,分别选出至少一条目标文本信息,并对每个目标文本信息添加类型标识,以形成至少一个文本信息模板;根据至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型。通过该方法,能够解决现有技术中无法对浏览器弹窗日志进行分析的问题,基于训练得到的文本分类模型对系统进行监测和分析,能够提高系统运维效率。CN114281939ACN114281939A权利要求书1/2页1.一种文本分类模型的训练方法,其特征在于,包括:获取多条浏览器的历史弹窗内的文本信息;对每个所述文本信息进行分词处理,根据分词结果确定出每个所述文本信息对应的第一特征向量;对所述第一特征向量进行聚类,得到至少一个文本信息组;从每个所述文本信息组中,分别选出至少一条目标文本信息,并对每个所述目标文本信息添加类型标识,以形成至少一个文本信息模板;根据所述至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型。2.根据权利要求1所述的方法,其特征在于,所述对每个所述文本信息进行分词处理,根据分词结果确定出每个所述文本信息对应的第一特征向量,包括:对每个所述文本信息进行分词处理,生成第一词袋;确定所述第一词袋中,任一第一词汇对应的第二特征向量;根据所述第二特征向量,确定所述每个文本信息对应的第一特征向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述第二特征向量,确定所述每个所述历史弹窗内的文本信息对应的第一特征向量,包括:获取所述第一词袋中的所述第一词汇的总数量;获取所述第一词袋中的每个所述第一词汇在多个所述文本信息中的出现频次,以及包含每个所述第一词汇的文本信息数量;根据所述第一词袋中的第一词汇的总数量、每个所述第一词汇在多个所述历史弹窗内的文本信息中的出现频次,以及包含每个所述第一词汇的文本信息数量,确定每个所述第一词汇分别对应的权重;根据所述第一词袋中的每个所述第一词汇分别对应的权重,以及每个所述第一词汇对应的第二特征向量,确定每个所述历史弹窗内的文本信息对应的第一特征向量。4.根据权利要求1‑3任一项所述的方法,其特征在于,所述根据所述至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型,包括:对每个所述文本信息模板进行分词处理,生成第二词袋;确定所述第二词袋中,任一第二词汇对应的第三特征向量;根据文本相似度算法和所述第三特征向量,对初始文本分类模型进行训练,得到所述文本分类模型。5.根据权利要求2所述的方法,其特征在于,所述确定所述第一词袋中,任一第一词汇对应的第二特征向量之后,还包括:对所述第二特征向量进行降维处理,得到降维后的第二特征向量;相应的,所述根据所述第二特征向量,确定所述每个所述历史弹窗内的文本信息对应的第一特征向量,包括:根据所述降维后的第二特征向量,确定所述每个所述历史弹窗内的文本信息对应的第一特征向量。6.一种文本分类方法,其特征在于,包括:获取待分类文本信息,所述文本信息为浏览器的弹窗内的信息;对所述待分类文本信息进行分词处理,生成第三词袋;2CN114281939A权利要求书2/2页将所述第三词袋输入预先训练的文本分类模型中,得到所述待分类文本信息的类型,所述文本分类模型为通过多条浏览器的历史弹窗内的文本信息进行分词处理,根据分词结果确定出每个所述文本信息对应的第一特征向量,并对所述第一特征向量进行聚类,得到至少一个文本信息组,并从每个所述文本信息组中,分别选出至少一条目标文本信息,并对每个所述目标文本信息添加类型标识,以形成至少一个文本信息模板,并根据所述至少一个文本信息模板,对初始文本分类模型进行训练后得到。7.根据权利要求6所述的方法