预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113704568A(43)申请公布日2021.11.26(21)申请号202110372174.0(22)申请日2021.04.07(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人朱朝悦石磊马连洋(74)专利代理机构广州三环专利商标代理有限公司44202代理人熊永强贾允(51)Int.Cl.G06F16/903(2019.01)G06F16/906(2019.01)G06F16/951(2019.01)G06F16/9535(2019.01)权利要求书2页说明书16页附图7页(54)发明名称内容识别方法、装置、设备及存储介质(57)摘要本申请涉及一种内容识别方法、装置、设备及存储介质,属于人工智能的自然语言处理技术领域,该方法包括:获取初始识别模式,初始识别模式是基于多个具有相同的第一预设时效值的第一时效性关键词构建的;根据第一时效性关键词的词性对初始识别模式进行变换,得到候选识别模式;分别使用初始识别模式和候选识别模式对待测试内容进行识别,并根据识别结果从候选识别模式中确定目标识别模式;利用目标识别模式对待识别内容进行识别,以确定待识别内容是否具有第一预设时效值。本申请能够避免依赖人为提供时效分类数量和类别,在提高准确率的前提下,可适用于任何内容的时效性识别,提高了适用性。CN113704568ACN113704568A权利要求书1/2页1.一种内容识别方法,其特征在于,所述方法包括:获取初始识别模式,所述初始识别模式是基于预设时效性词库中的多个第一时效性关键词构建的,所述多个第一时效性关键词具有相同的第一预设时效值;根据所述第一时效性关键词的词性对所述初始识别模式进行变换,得到候选识别模式;使用所述初始识别模式对测试集中的待测试内容进行识别,得到所述初始识别模式的第一时效性测试结果;以及,使用所述候选识别模式对所述测试集中的所述待测试内容进行识别,得到所述候选识别模式的第二时效性测试结果;其中,所述待测试内容具有所述第一预设时效值;根据所述第一时效性测试结果与所述第二时效性测试结果,从所述候选识别模式中确定目标识别模式;利用所述目标识别模式对待识别内容进行识别,以确定所述待识别内容的时效性识别结果,所述时效性识别结果表征所述待识别内容是否具有所述第一预设时效值。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一时效性测试结果与所述第二时效性测试结果,从所述候选识别模式中确定目标识别模式,包括:基于所述第一时效性测试结果,确定初始正确识别总数;基于所述第二时效性测试结果,确定候选正确识别总数;根据所述候选正确识别总数以及所述初始正确识别总数,确定所述候选识别模式的置信度值;根据多个所述候选识别模式的置信度值,确定所述目标识别模式。3.根据权利要求2所述的方法,其特征在于,所述根据所述候选正确识别总数以及所述初始正确识别总数,确定所述候选识别模式的置信度值,包括:根据所述候选正确识别总数,确定所述候选识别模式的准确率;将所述候选正确识别总数与所述初始正确识别总数之比,确定为所述候选识别模式的召回率;根据所述准确率和所述召回率确定所述候选识别模式的置信度值。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述多个候选识别模式的置信度值,确定所述目标识别模式,包括:从多个所述候选识别模式中,选取所述置信度值大于预设置信度阈值的所述候选识别模式;按照所述置信度值由高至低的顺序对选取结果进行排序;将排序靠前的第一数量阈值个所述候选识别模式,确定为所述目标识别模式。5.根据权利要求2所述的方法,其特征在于,所述基于所述第一时效性测试结果,确定初始正确识别总数,包括:将多个所述初始识别模式的所述第一时效性测试结果进行合并,得到时效性测试合并结果;基于所述时效性测试合并结果,得到所述初始正确识别总数。6.根据权利要求1或2所述的方法,其特征在于,所述初始识别模式中所包含的所述第一时效性关键词的所述词性相同;2CN113704568A权利要求书2/2页所述根据所述第一时效性关键词的词性对所述初始识别模式进行变换,得到候选识别模式,包括:将所述初始识别模式中的所述第一时效性关键词的所述词性,确定为所述初始识别模式的所述词性;对具有相同所述词性的多个所述初始识别模式之间进行第一逻辑组合,得到变换模式集;对所述变换模式集中各个变换模式进行第二逻辑组合,得到所述候选识别模式。7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:每间隔预设时间,对所述预设时效性词库进行更新;所述对所述预设时效性词库进行更新,包括:爬取具有第二预设时效值的文章内容,得到第二时效性关键词;统计所述第二时效