预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109960814A(43)申请公布日2019.07.02(21)申请号201910227374.X(22)申请日2019.03.25(71)申请人北京金山数字娱乐科技有限公司地址100085北京市海淀区小营西路33号金山软件大厦2层西区申请人成都金山互动娱乐科技有限公司(72)发明人李长亮李小龙唐剑波王勇博(74)专利代理机构北京智信禾专利代理有限公司11637代理人吴肖肖(51)Int.Cl.G06F17/28(2006.01)权利要求书3页说明书16页附图4页(54)发明名称模型参数搜索方法以及装置(57)摘要本申请提供模型参数搜索方法以及装置,其中,所述模型参数搜索方法包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。本申请提供的模型参数搜索方法,结合语料库中的语料和语料经翻译模型翻译后的翻译概率在参数空间中对翻译模型的权重参数进行搜索,提升了参数搜索效率,并且使应用搜索获得的目标权重参数的翻译模型的翻译准确率更高,得到更准确的翻译结果。CN109960814ACN109960814A权利要求书1/3页1.一种模型参数搜索方法,其特征在于,包括:获取至少两个翻译模型对语料库中的语料进行翻译后输出的各自的译文,以及所述译文中每个译句的翻译概率;基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组;将搜索到的目标权重参数组包含的权重参数分别作为所述至少两个翻译模型的目标权重参数。2.根据权利要求1所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组,包括:基于所述译文和所述译文中每个译句的翻译概率构建搜索树;所述参数空间中的权重参数组与所述搜索树中的搜索节点一一对应;按照所述搜索树在所述参数空间中搜索所述至少两个翻译模型对应的权重参数组。3.根据权利要求2所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率构建搜索树子步骤执行过程中,针对所述参数空间中的权重参数组对应所述搜索树中的搜索节点,执行如下操作:根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数,并结合所述译文中每个译句的翻译概率计算所述搜索节点的启发代价;其中,所述搜索节点的启发代价根据所述至少两个翻译模型中每个翻译模型的模型启发代价计算获得,每个翻译模型的模型启发代价为该翻译模型的权重参数与所述译文中每个译句的翻译概率的乘积之和。4.根据权利要求3所述的模型参数搜索方法,其特征在于,所述搜索树中任意一个搜索节点的下层搜索节点,采用如下方式确定:采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合;根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点。5.根据权利要求4所述的模型参数搜索方法,其特征在于,所述采用高斯算法确定所述搜索树中与所述搜索节点相邻且具有连接关系的相邻搜索节点的搜索节点集合子步骤执行之后,且所述根据计算获得的所述搜索节点集合中每个相邻搜索节点的启发代价,在所述搜索节点集合中选择启发代价最高的至少一个相邻搜索节点作为所述搜索节点的下层搜索节点子步骤执行之前,包括:针对所述搜索节点集合中的搜索节点,根据所述搜索节点对应的所述参数空间中的权重参数组,将所述权重参数组作为所述至少两个翻译模型的权重参数;以所述至少两个翻译模型的所述权重参数为依据,采用重排序对所述至少两个翻译模型各自输出的文本译文进行融合,获得所述待翻译文本的参考文本译文;将所述参考文本译文与所述语料的真实译文进行比对,确定所述参考文本译文相对于所述真实译文的翻译准确率和/或翻译损失;2CN109960814A权利要求书2/3页判断所述翻译准确率和/或所述翻译损失是否大于所述搜索节点的上层搜索节点对应的翻译准确率和/或翻译损失;若不大于,将所述搜索节点从其所属的搜索节点集合中剔除。6.根据权利要求1所述的模型参数搜索方法,其特征在于,所述基于所述译文和所述译文中每个译句的翻译概率,在参数空间中搜索所述至少两个翻译模型对应的权重参数组步骤,基于集束搜索算法实现。7.根据权利要求1所述的模型参数搜索方法,其特征在于,所述将搜索到的目标权重参数组包含