预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114297383A(43)申请公布日2022.04.08(21)申请号202111643213.2(22)申请日2021.12.29(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人任华王铮汪少敏杨迪马兆铭(74)专利代理机构中国贸促会专利商标事务所有限公司11038代理人方亮(51)Int.Cl.G06F16/35(2019.01)G06F40/289(2020.01)G06K9/62(2022.01)权利要求书3页说明书7页附图4页(54)发明名称关键信息识别方法、装置以及存储介质(57)摘要本公开提供了一种关键信息识别方法、装置以及存储介质,其中的方法包括:对于关键信息设置对应的权重系数值以及权重系数阈值;如果至少一个权重系数值大于权重系数阈值,则将与大于权重系数阈值的权重系数值对应的关键信息作为识别目标关键信息,并根据识别目标关键信息对待识别文本进行分类处理;如果全部权重系数值都小于或等于权重系数阈值,则计算关键信息之间的关联因子信息;基于关联因子信息计算与待识别文本相对的关联识别权重值,根据关联识别权重值对待识别文本进行分类处理。本公开的方法、装置以及存储介质,可以通过累计相关性提升关键信息识别效果,提升识别的准确率。CN114297383ACN114297383A权利要求书1/3页1.一种关键信息识别方法,包括:获取待识别文本中的关键信息,确定与关键信息相对应的分类信息;对于所述关键信息设置对应的权重系数值以及权重系数阈值;如果至少一个权重系数值大于所述权重系数阈值,则将与大于所述权重系数阈值的权重系数值对应的关键信息作为识别目标关键信息,并根据所述识别目标关键信息对所述待识别文本进行分类处理;如果全部权重系数值都小于或等于所述权重系数阈值,则计算所述关键信息之间的关联因子信息;基于所述关联因子信息计算与所述待识别文本相对的关联识别权重值,根据所述关联识别权重值对所述待识别文本进行分类处理。2.如权利要求1所述的方法,所述计算所述关键信息之间的关联因子信息包括:基于所述分类信息对全部关键信息进行分组处理,生成至少一个关键信息组;计算所述关键信息组中的各个组关键信息之间的关联因子。3.如权利要求2所述的方法,所述计算所述关键信息组中的各个组关键信息之间的关联因子包括:基于识别样本计算所述组关联信息之间的置信度和支持度;根据所述置信度和所述支持度确定所述关联因子。4.如权利要求2所述的方法,所述基于所述关联因子信息计算与所述待识别文本相对的关联识别权重值包括:将所述关键信息组中的各个组关键信息的权重系数值与对应的关联因子的乘积作为关联权重值;将所述关键信息组的全部关联权重值之和,作为所述关联识别权重值。5.如权利要求4所述的方法,所述根据所述关联识别权重值对所述待识别文本进行分类处理包括:获取各个关键信息组的关联识别权重值;根据全部关联识别权重值中的最大关联识别权重值,对所述待识别文本进行分类处理。6.如权利要求1所述的方法,所述根据所述识别目标关键信息对所述待识别文本进行分类处理包括:如果所述识别目标关键信息的数量为1个,则根据此识别目标关键信息对所述待识别文本进行分类处理。7.如权利要求1所述的方法,所述根据所述识别目标关键信息对所述待识别文本进行分类处理包括:如果所述识别目标关键信息的数量为两个,则根据较大的权重系数值对应的识别目标关键信息对所述待识别文本进行分类处理。8.如权利要求1所述的方法,所述根据所述识别目标关键信息对所述待识别文本进行分类处理包括:如果所述识别目标关键信息的数量大于两个,则基于分类信息对全部目标关键信息进行分组处理;2CN114297383A权利要求书2/3页计算各个识别目标关键信息组中的全部识别目标关键信息的权重系数值的平均值;根据与最大平均值对应的识别目标关键信息组的分类信息,对所述待识别文本进行分类处理。9.一种关键信息识别装置,包括:分类确定模块,用于获取待识别文本中的关键信息,确定与所述关键信息相对应的分类信息;权重确定模块,用于对于所述关键信息设置对应的权重系数值以及权重系数阈值第一识别处理模块,用于如果至少一个权重系数值大于所述权重系数阈值,则将与大于所述权重系数阈值的权重系数值对应的关键信息作为识别目标关键信息,并根据所述识别目标关键信息对所述待识别文本进行分类处理;第二识别处理模块,用于如果全部权重系数值都小于或等于所述权重系数阈值,则计算所述关键信息之间的关联因子信息;基于所述关联因子信息计算与所述待识别文本相对的关联识别权重值,根据所述关联识别权重值对所述待识别文本进行分类处理。10.如权利要求9所述的装置,其中,所述第二识别处理模块,包括:关联因