预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761142A(43)申请公布日2021.12.07(21)申请号202011025814.2G06K9/62(2006.01)(22)申请日2020.09.25G06N3/04(2006.01)(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人胡珅健(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人李阳王志远(51)Int.Cl.G06F16/332(2019.01)G06F16/33(2019.01)G06F40/279(2020.01)G06F40/30(2020.01)权利要求书2页说明书11页附图7页(54)发明名称一种生成答案摘要的方法和装置(57)摘要本发明公开了一种生成答案摘要的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取与用户的查询问题对应的原始答案文本,并对所述原始答案文本进行切割,得到多个答案句子;分别将所述多个答案句子与所述查询问题组合,得到多个问答对;基于所述问答对中每个字的字向量和所述字所在词的词向量,确定所述字的分布式语义向量;基于所述分布式语义向量和预设的神经网络模型,确定每个问答对中的答案句子与所述查询问题的语义相似度;根据所述语义相似度,从所述多个答案句子中确定与所述查询问题对应的答案摘要。该实施方式提高了答案摘要的精度,扩大了使用范围,克服了近义词问题和由于错别字引入的未登录词问题。CN113761142ACN113761142A权利要求书1/2页1.一种生成答案摘要的方法,其特征在于,包括:获取与用户的查询问题对应的原始答案文本,并对所述原始答案文本进行切割,得到多个答案句子;分别将所述多个答案句子与所述查询问题组合,得到多个问答对;基于所述问答对中每个字的字向量和所述字所在词的词向量,确定所述字的分布式语义向量;基于所述分布式语义向量和预设的神经网络模型,确定每个问答对中的答案句子与所述查询问题的语义相似度;根据所述语义相似度,从所述多个答案句子中确定与所述查询问题对应的答案摘要。2.根据权利要求1所述的方法,其特征在于,对所述原始答案文本进行切割包括:确定所述原始答案文本中的标点符号;根据所述标点符号,对所述原始答案文本进行切割。3.根据权利要求1所述的方法,其特征在于,基于所述问答对中每个字的字向量和所述字所在词的词向量,确定所述字的分布式语义向量包括:对于所述问答对中的每个字,基于预设的字向量查找表,确定所述字的字向量;对所述问答对进行分词操作,得到多个词;基于所述多个词,确定所述字所在词;基于预设的词向量查找表,确定所述字所在词的词向量;计算所述字的字向量和所述字所在词的词向量的均值,将所述均值作为所述字的分布式语义向量。4.根据权利要求1所述的方法,其特征在于,所述预设的神经网络模型根据如下过程获得:获取训练数据集,所述训练数据集中包括多个样本数据;基于所述样本数据中每个待训练字的字向量和所述待训练字所在词的词向量,确定所述待训练字的分布式语义向量,将所述待训练字的分布式语义向量输入多尺度卷积层,得到所述样本数据的特征向量;对所述样本数据的特征向量进行降采样,得到所述样本数据的语义向量;对所述语义向量进行训练,得到所述预设的神经网络模型。5.根据权利要求4所述的方法,其特征在于,所述样本数据包括问题数据、与所述问题数据对应的正向答案数据和与所述问题数据对应的负向答案数据;所述样本数据的语义向量包括所述问题数据的语义向量、所述正向答案数据的语义向量和所述负向答案数据的语义向量;对所述语义向量进行训练,得到所述预设的神经网络模型包括:利用Pairwise方法和最大间隔距离函数训练所述问题数据的语义向量、所述正向答案数据的语义向量和所述负向答案数据的语义向量,得到所述预设的神经网络模型。6.根据权利要求5所述的方法,其特征在于,所述最大间隔距离函数的计算过程如下:利用所述问题数据的语义向量和所述正向答案数据的语义向量,计算所述问题数据与所述正向答案数据的语义相似度,并将所述问题数据与所述正向答案数据的语义相似度作为第一语义相似度;2CN113761142A权利要求书2/2页利用所述问题数据的语义向量和所述负向答案数据的语义向量,计算所述问题数据与所述负向答案数据的语义相似度,并将所述问题数据与所述负向答案数据的语义相似度作为第二语义相似度;计算所述第一语义相似度与所述第二语义相似度的差值;利用合页损失函数、所述第一语义相似度与所述第二语义相似度的差值和预设的间隔距离阈值,计算所述第一语义相似度与所述第二语义相似度的最大间隔距离。7.一种生成答案摘要的