预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113886568A(43)申请公布日2022.01.04(21)申请号202111169246.8(22)申请日2021.09.30(71)申请人宿迁硅基智能科技有限公司地址210012江苏省宿迁市湖滨新区保险小镇B19栋201室(72)发明人司马华鹏华冰涛汤毅平汪成靳超超(74)专利代理机构北京弘权知识产权代理有限公司11363代理人逯长明许伟群(51)Int.Cl.G06F16/34(2019.01)G06F40/211(2020.01)G06F40/216(2020.01)G06K9/62(2006.01)权利要求书3页说明书17页附图5页(54)发明名称一种文本摘要的生成方法及装置(57)摘要本申请提供了一种文本摘要的生成方法及装置,可以通过构建目标文本中各分句之间的句子网络关系,以准确获取各分句之间的邻接关系,从句子关系网络中确定由所代表的文本内容高度统一的多个分句构成的子关系网络,并通过准确计算各子关系网络与句子关系网络之间的文档相似度,以确定作为文本摘要的目标子关系网络。可见,本申请所提供的文本摘要的生成方法可以有效提高所生成的文本摘要的文本内容与目标文本的文本内容之间的匹配度,令文本摘要更加准确地代表目标文本,从而可以为后续匹配目标视频素材提供更加准确的文本基础,以提高所匹配到的目标视频素材的准确性。CN113886568ACN113886568A权利要求书1/3页1.一种文本摘要的生成方法,其特征在于,包括:将目标文本划分为多个分句;构建句子关系网络,所述句子关系网络包括所述多个分句中的全部节点分句,以及每一个所述节点分句与相应的邻接分句之间的对应关系,其中,所述节点分句对应至少一个句子相似度大于或者等于相似度阈值的所述邻接分句;基于所述句子关系网络,获取每一个所述节点分句对应的子关系网络,所述子关系网络包括所述节点分句以及所述节点分句的至少一个邻接分句;生成所述目标文本的文本摘要,所述文本摘要包括目标子关系网络中的全部分句,所述目标子关系网络是指与所述句子关系网络之间具有最高文档向量相似度的所述子关系网络。2.根据权利要求1所述的方法,其特征在于,在所述将目标文本划分为多个分句之前还包括:获取待处理文本;将所述待处理文本划分为多个待处理分句;获取每个所述待处理分句中的第一文本和第二文本,其中,所述第一文本与所述待处理文本所属的目标领域中的核心类别对应,所述第二文本与所述目标领域中的非核心类别对应;根据每个所述待处理分句对应的分句向量,计算各所述待处理分句之间的句子相似度,所述待处理分句对应的分句向量由相应的所述第一文本和所述第二文本构成;将所述多个待处理分句划分为多个所述目标文本,每个所述目标文本包括多个目标分句,所述多个目标分句之间的句子相似度大于或者等于预设句子相似度阈值。3.根据权利要求2所述的方法,其特征在于,在将所述多个待处理分句划分为多个所述目标文本之后,还包括:获取各所述目标分句在所述待处理文本中的位置;按照各所述目标分句在所述待处理文本中的位置,将所述目标文本中的各所述目标分句排序。4.根据权利要求1所述的方法,其特征在于,所述构建句子关系网络包括:以每个所述分句作为中心分句,计算所述中心分句与所述多个分句中其它分句之间的句子相似度;确定节点分句和所述节点分句的邻接分句,所述节点分句是指具有邻接分句的所述中心分句,所述邻接分句是指与所述节点分句的句子相似度大于或者等于句子相似度阈值的所述其它分句;建立各所述节点分句与所述邻接分句之间的对应关系,得到所述句子关系网络。5.根据权利要求1所述的方法,其特征在于,所述获取每一个所述节点分句对应的子关系网络包括:根据预设的文本摘要所包含的句子数量N,获取每一个所述节点分句对应的全部子关系网络,其中,每个所述子关系网络包括所述节点分句和所述节点分句对应的N‑1个所述邻接分句,N≥1。6.根据权利要求5所述的方法,其特征在于,所述生成所述目标文本的文本摘要包括:2CN113886568A权利要求书2/3页获取候选子关系网络,所述候选子关系网络是指中心度大于或者等于中心度阈值的所述子关系网络;生成所述文本摘要,所述文本摘要包括所述目标子关系网络中的全部分句,所述目标子关系网络是指与所述句子关系网络之间具有最高文档向量相似度的所述候选子关系网络。7.根据权利要求6所述的方法,其特征在于,计算所述子关系网络的中心度的步骤包括:计算各所述子关系网络中每个所述分句对应的第一中心度,所述第一中心度根据所述分句的向前影响和向后影响计算获得;计算每个所述子关系网络中各所述分句对应的中心度的加权平均值,得到每个所述子关系网络的中心度。8.根据权利要求1所述的方法,其特征在于,计算所述文档向量相