预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761140A(43)申请公布日2021.12.07(21)申请号202010812316.6G06K9/62(2006.01)(22)申请日2020.08.13G06N3/04(2006.01)(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人胡珅健(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人张一军王安娜(51)Int.Cl.G06F16/332(2019.01)G06F16/901(2019.01)G06F40/289(2020.01)G06F40/30(2020.01)权利要求书2页说明书11页附图5页(54)发明名称一种答案排序方法和装置(57)摘要本发明公开了一种答案排序方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取若干组问答数据作为训练样本;其中,每组问答数据包括问题例句和答案例句,所述答案例句包括正向答案例句和负向答案例句;计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型;其中,所述排序模型包括串联的循环神经网络和卷积神经网络;采用训练后的排序模型,计算目标问题对应的各个候选答案的匹配概率,从而对所述各个候选答案进行排序。该实施方式能够解决答案排序结果不准确的技术问题。CN113761140ACN113761140A权利要求书1/2页1.一种答案排序方法,其特征在于,包括:获取若干组问答数据作为训练样本;其中,每组问答数据包括问题例句和答案例句,所述答案例句包括正向答案例句和负向答案例句;计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型;其中,所述排序模型包括串联的循环神经网络和卷积神经网络;采用训练后的排序模型,计算目标问题对应的各个候选答案的匹配概率,从而对所述各个候选答案进行排序。2.根据权利要求1所述的方法,其特征在于,计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型,包括:计算所述问答数据的各个字的浅层混合字词向量;将所述问答数据的各个字的浅层混合字词向量输入到排序模型中,并采用成对方法和最大间隔算法训练所述排序模型。3.根据权利要求2所述的方法,其特征在于,计算所述问答数据的各个字的浅层混合字词向量,包括:对所述问答数据进行切词和词向量转换,得到各个词的词向量;对所述问答数据进行切字和字向量转换,得到各个字的字向量;对于所述问答数据中的每个字,根据所述字的字向量和所述字所在词的词向量,计算所述字的浅层混合字词向量。4.根据权利要求3所述的方法,其特征在于,根据所述字的字向量和所述字所在词的词向量,计算所述字的浅层混合字词向量,包括:根据预设的词向量权重和字向量权重,对所述字的字向量和所述字所在词的词向量进行加权求和,得到所述字的浅层混合字词向量。5.根据权利要求2所述的方法,其特征在于,所述排序模型包括并联的第一神经网络、第二神经网络和第三神经网络;其中,所述第一神经网络包括串联的第一循环神经网络和第一卷积神经网络;所述第二神经网络包括串联的第二循环神经网络和第二卷积神经网络;所述第三神经网络包括串联的第三循环神经网络和第三卷积神经网络。6.根据权利要求5所述的方法,其特征在于,将所述问答数据的各个字的浅层混合字词向量输入到排序模型中,并采用成对方法和最大间隔算法训练所述排序模型,包括:将所述正向答案例句的各个字的浅层混合字词向量输入到所述第一循环神经网络中,通过所述第一卷积神经网络输出所述正向答案例句的语义向量;将所述问题例句的各个字的浅层混合字词向量输入到所述第二循环神经网络中,通过所述第二卷积神经网络输出所述问题例句的语义向量;以及,将所述负向答案例句的各个字的浅层混合字词向量输入到所述第三循环神经网络中,通过所述第三卷积神经网络输出所述负向答案例句的语义向量;采用成对方法和最大间隔算法来训练所述排序模型。7.根据权利要求6所述的方法,其特征在于,采用成对方法和最大间隔算法来训练所述排序模型,包括:计算所述正向答案例句的语义向量与所述问题例句的语义向量之间的相似度,得到正2CN113761140A权利要求书2/2页向相似度;计算所述负向答案例句的语义向量与所述问题例句的语义向量之间的相似度,得到负向相似度;基于所述正向相似度和所述负向相似度,并采用最大间隔算法作为损失函数来训练所述排序模型。8.一种答案排序装置,其特征在于,包括:获取模块,用于获取若干组问答数据作为训练样本;其中,每组问答数据包括问题例句和答案例句,所述答案例句包括正向答案例句和负向答案例句;训练模块,用于计算所述问答数据的各个字的浅层混合字词向量,以训练排序模型