预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113822038A(43)申请公布日2021.12.21(21)申请号202110621220.6G06N20/00(2019.01)(22)申请日2021.06.03(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人康战辉(74)专利代理机构深圳市深佳知识产权代理事务所(普通合伙)44285代理人王兆林(51)Int.Cl.G06F40/194(2020.01)G06F40/279(2020.01)G06F40/30(2020.01)G06F16/33(2019.01)G06F16/35(2019.01)权利要求书2页说明书16页附图6页(54)发明名称一种摘要生成方法和相关装置(57)摘要本申请实施例公开了一种摘要生成方法和相关装置,至少涉及人工智能技术中的自然语言处理技术、机器学习等,针对基于检索词确定的目标文本,根据分词的分词向量,对目标文本包括的多个分词进行语义聚类,得到多个语义集合,处于同一个语义集合中的分词所表达的语义较为相似。通过确定检索词的词向量分别与多个语义集合中分词向量的语义相似度,将满足语义相似度条件的语义集合作为目标语义集合。基于目标语义集合所包括的分词在目标文本中的位置,生成目标文本针对检索词的摘要内容。由于目标语义集合中分词在语义上与检索词更为接近,基于该目标语义集合所生成的摘要内容在语义上会贴近检索词,提高了摘要内容的准确性,满足了用户的检索需求。CN113822038ACN113822038A权利要求书1/2页1.一种摘要生成方法,其特征在于,所述方法包括:获取基于检索词确定的目标文本,所述目标文本包括多个分词;根据所述分词的分词向量,将所述多个分词进行语义聚类,得到多个语义集合;根据检索词的检索词向量,确定所述检索词分别与所述语义集合对应的第一语义相似度,将所述第一语义相似度满足第一相似度条件的语义集合确定为目标语义集合;基于所述目标语义集合所包括分词在所述目标文本中的位置,生成所述目标文本针对所述检索词的摘要内容。2.根据权利要求1所述的方法,其特征在于,所述根据所述分词的分词向量,将所述多个分词进行语义聚类,得到多个语义集合,包括:根据所述分词的分词向量,确定所述多个分词中任意两个分词间的第二语义相似度;确定所述第二语义相似度满足第二相似度条件的分词间具有关联关系;根据所述分词向量和所述关联关系,从所述多个分词中确定关键词;基于所述关键词进行语义聚类,得到多个语义集合。3.根据权利要求1所述的方法,其特征在于,所述目标文本的内容涉及多个主题,对应不同主题的分词被划分至不同的语义集合中。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述语义集合所包括分词的分词向量,确定所述语义集合的集合向量;所述根据检索词的检索词向量,确定所述检索词分别与所述语义集合对应的第一语义相似度,将所述第一语义相似度满足第一相似度条件的语义集合确定为目标语义集合,包括:根据检索词的检索词向量和所述集合向量,确定所述检索词分别与所述语义集合对应的第一语义相似度,将所述第一语义相似度满足第一相似度条件的语义集合确定为目标语义集合。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述语义集合所包括分词的分词数量满足数量条件的语义集合确定为待处理集合;所述根据检索词的检索词向量,确定所述检索词分别与所述语义集合对应的第一语义相似度,将所述第一语义相似度满足第一相似度条件的语义集合确定为目标语义集合,包括:根据检索词的检索词向量,确定所述检索词分别与所述待处理集合对应的第一语义相似度,将所述第一语义相似度满足第一相似度条件的待处理集合确定为目标语义集合。6.根据权利要求1‑5任意一项所述的方法,其特征在于,所述基于所述目标语义集合所包括分词在所述目标文本中的位置,生成所述目标文本针对所述检索词的摘要内容,包括:确定所述目标语义集合所包括分词在所述目标文本中所处的多个段落;根据所述多个段落中分别包括所述目标语义集合所包括分词的数量,从所述多个段落中确定目标段落;根据所述目标段落生成所述目标文本针对所述检索词的摘要内容。7.根据权利要求1‑5任意一项所述的方法,其特征在于,所述基于所述目标语义集合所包括分词在所述目标文本中的位置,生成所述目标文本针对所述检索词的摘要内容,包括:确定所述目标语义集合所包括分词在所述目标文本中所处的多个语句;2CN113822038A权利要求书2/2页根据所述多个语句中分别包括所述目标语义集合所包括分词的数量,从所述多个语句中确定目标语句;根据所述目标语句生成所述目标文本针对所述检索词的摘要内容。8.一种摘要生成装置,其特征在