预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114254659A(43)申请公布日2022.03.29(21)申请号202010998594.5(22)申请日2020.09.21(71)申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间(72)发明人卫林钰张旭陈伟(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人苏培华(51)Int.Cl.G06F40/58(2020.01)G06F40/42(2020.01)G06N3/04(2006.01)权利要求书2页说明书11页附图7页(54)发明名称翻译方法及装置、计算机可读存储介质和电子设备(57)摘要本发明提供了一种翻译方法及装置、计算机可读存储介质和电子设备,涉及数据处理技术领域。该翻译方法包括:获取源语言的待翻译信息对应的文本识别信息,其中,文本识别信息包括混淆网络;将文本识别信息输入翻译模型,以生成待翻译信息对应的目标语言的翻译结果。由于包括混淆网络的文本识别信息能够有效丰富待翻译信息的文本识别结果,因此,本发明提供的翻译方法能够提高翻译精准度。CN114254659ACN114254659A权利要求书1/2页1.一种翻译方法,其特征在于,包括:获取源语言的待翻译信息对应的文本识别信息,其中,所述文本识别信息包括混淆网络;将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果。2.根据权利要求1所述的翻译方法,其特征在于,所述文本识别信息包括:多个候选文本识别结果及其各自对应的权重信息,其中,所述多个候选文本识别结果对应于所述混淆网络上的多条候选路径。3.根据权利要求2所述的翻译方法,其特征在于,所述多个候选文本识别结果中的每个候选文本识别结果包括多个候选文本识别单元,所述权重信息包括所述多个候选文本识别单元各自对应的概率信息。4.根据权利要求1所述的翻译方法,其特征在于,所述翻译模型是经过混淆网络训练得到的。5.根据权利要求1至4任一项所述的翻译方法,其特征在于,当所述待翻译信息为待翻译语音信息时,在所述将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果之前,还包括:基于所述待翻译语音信息提取声学特征信息;其中,所述将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果,包括:将所述文本识别信息和所述声学特征信息输入所述翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果。6.根据权利要求4所述的翻译方法,其特征在于,在基于混淆网络训练得到所述翻译模型之前,还包括:基于所述混淆网络中的候选文本识别单元生成文本嵌入信息;基于所述混淆网络中的候选路径生成基于词格的位置嵌入信息;基于所述文本嵌入信息、所述基于词格的位置嵌入信息和所述混淆网络中的候选文本识别单元对应的概率信息构建并训练所述翻译模型。7.一种翻译装置,其特征在于,包括:获取模块,用于获取源语言的待翻译信息对应的文本识别信息,其中,所述文本识别信息包括混淆网络;翻译模块,用于将所述文本识别信息输入翻译模型,以生成所述待翻译信息对应的目标语言的翻译结果。8.根据权利要求7所述的翻译装置,其特征在于,当所述待翻译信息为待翻译语音信息时,所述翻译装置还包括语音合成模块,用于将所述目标语言的翻译结果合成目标语言的语音信息。9.一种计算机可读存储介质,其特征在于,所述存储介质存储有指令,当所述指令由电子设备的处理器执行时,使得所述电子设备能够执行上述权利要求1至6任一项所述的翻译方法。10.一种电子设备,其特征在于,所述电子设备包括:2CN114254659A权利要求书2/2页处理器;用于存储所述计算机可执行指令的存储器;所述处理器,用于执行所述计算机可执行指令,以实现上述权利要求1至6任一项所述的翻译方法。3CN114254659A说明书1/11页翻译方法及装置、计算机可读存储介质和电子设备技术领域[0001]本发明涉及数据处理技术领域,具体涉及翻译方法及装置、计算机可读存储介质和电子设备。背景技术[0002]近年来,随着全球化的加速发展,越来越多的翻译需求日益涌现。相应地,翻译技术也日益受到关注,尤其是将一个语种(源语言)的语音翻译成另一个语种(目标语言)的文本或者语音的语音翻译技术。[0003]然而,现有翻译技术的翻译准确度和鲁棒性均较差。即使是基于神经网络的翻译技术,由于受限于训练数据和模型结构的影响,其翻译效果仍然不够理想。发明内容[0004]为了解决上述技术问题,提出了本发明。本发明的实施例提供了一种翻译方法及装置、计算机可读存储介质和电子设备。[0005]第一方面,本发明一实施例提供一种翻译方法,该方法包括:获取源语言的待翻译信息对应的文本