文本翻译方法、装置、电子设备及可读存储介质-豆柴文库

文本翻译方法、装置、电子设备及可读存储介质.pdf

2023-11-15

10金币

1MB

27页

傲丝****账号

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110210043A(43)申请公布日2019.09.06(21)申请号201910514220.9(22)申请日2019.06.14(71)申请人科大讯飞股份有限公司地址230000安徽省合肥市高新开发区望江西路666号(72)发明人李亚刘丹刘俊华(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人荣甜甜刘芳(51)Int.Cl.G06F17/28(2006.01)G06F17/27(2006.01)权利要求书3页说明书16页附图7页(54)发明名称文本翻译方法、装置、电子设备及可读存储介质(57)摘要本申请提供一种文本翻译方法、装置、电子设备及可读存储介质，方法包括：接收待翻译的源语言文本；将所述源语言文本输入到翻译模型中，由所述翻译模型根据多个双语短语对的信息，对所述源语言文本进行编码和解码，得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留，从而极大提升翻译效果。CN110210043ACN110210043A权利要求书1/3页1.一种文本翻译方法，其特征在于，包括：接收待翻译的源语言文本；将所述源语言文本输入到翻译模型中，由所述翻译模型根据多个双语短语对的信息，对所述源语言文本进行编码和解码，得到所述源语言文本对应的目标语言文本。2.根据权利要求1所述的方法，其特征在于，所述由所述翻译模型根据多个双语短语对的信息，对所述源语言文本进行编码和解码，包括：由所述翻译模型根据多个双语短语对的编码信息，对所述源语言文本进行编码和解码，其中，所述双语短语对的编码信息包括源语言短语的编码信息和所述源语言短语对应的目标语言短语的编码信息。3.根据权利要求2所述的方法，其特征在于，所述由所述翻译模型根据多个双语短语对的编码信息，对所述源语言文本进行编码和解码，包括：根据所述源语言文本中每个源语言词语的初始编码信息、所述源语言短语的编码信息以及所述目标语言短语的编码信息，确定每个所述源语言词语的目标编码信息，其中，所述初始编码信息通过对所述源语言文本进行编码得到；对每个源语言词语的所述目标编码信息进行解码处理，得到所述源语言文本对应的目标语言文本。4.根据权利要求3所述的方法，其特征在于，所述确定每个所述源语言词语的目标编码信息，包括：根据所述每个源语言词语的初始编码信息与所述源语言短语的编码信息的相似度，确定所述源语言短语对应的目标语言短语的编码信息的权重；根据所述源语言短语对应的目标语言短语的编码信息的权重、所述目标语言短语的编码信息以及所述初始编码信息，得到所述每个源语言词语的目标编码信息。5.根据权利要求1-4任一项所述的方法，其特征在于，所述将所述源语言文本输入到翻译模型之前，还包括：根据所述双语短语对的信息，对所述翻译模型进行训练，得到所述翻译模型的训练结果，所述训练结果包括所述翻译模型的损失信息，其中，所述翻译模型的损失信息根据所述多个双语短语对的信息得到；根据所述损失信息，修正所述翻译模型。6.根据权利要求5所述的方法，其特征在于，所述源语言短语的编码信息通过源编码矩阵表示，所述目标语言短语的编码信息通过目标编码矩阵表示；所述源编码矩阵中包括所述源语言短语的编码信息，所述目标编码矩阵中包括所述目标语言短语的编码信息。7.根据权利要求6所述的方法，其特征在于，所述根据所述双语短语对的编码信息，对所述翻译模型进行训练，包括：将源语言训练文本输入所述翻译模型，由所述翻译模型对所述源语言训练文本进行编码，得到所述源语言训练文本中每个源语言词语的编码信息；根据所述每个源语言词语的编码信息以及所述双语短语对的编码信息，确定所述翻译模型的损失信息。8.根据权利要求7所述的方法，其特征在于，所述确定所述翻译模型的损失信息，包括：2CN110210043A权利要求书2/3页根据所述源语言训练文本中每个源语言词语在所述源编码矩阵中对应的目标位置，确定每个源语言词语的损失权重信息；根据每个源语言词语的损失权重信息，确定所述翻译模型的损失信息。9.根据权利要求8所述的方法，其特征在于，所述确定每个源语言词语的损失权重信息，包括：根据每个源语言词语在所述源编码矩阵中对应的目标位置，得到每个源语言词语在所述目标位置上的编码信息；确定每个源语言词语的编码信息与所述目标位置上的编码信息的相似度；根据每个源语言词语的编码信息与所述目标位置上的编码信息的相似度，确定每个源语言词语的损失权重信息。10.根据权利要求8或9所述的方法，其特征在于，所述确定每个源语言词语的损失权重信息之前，还包括：根据所述源语言训练文本以及从所述源语言训练文本中提取出的源语言短语的文本信息，确定所述源语言训练文本中每个源语言词语在所述源编码矩阵中的

相关资料

文本翻译方法、装置、电子设备及可读存储介质.pdf

本申请提供一种文本翻译方法、装置、电子设备及可读存储介质，方法包括：接收待翻译的源语言文本；将所述源语言文本输入到翻译模型中，由所述翻译模型根据多个双语短语对的信息，对所述源语言文本进行编码和解码，得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留，从而极大提升翻译效果。

2023-11-15

1MB

文本显示方法、装置、电子设备及可读存储介质.pdf

本发明提供的一种文本显示方法、装置、电子设备及可读存储介质，方法包括：获得待处理文本的多个目标图层；其中，每个目标图层中包含待处理文本，和经过颜色渐变处理的目标文本；目标文本为待处理文本的部分文本；每个目标图层中的目标文本不同；根据设定的显示顺序和显示时长，依次显示多个目标图层。本申请可以获得待处理文本的多个目标图层，根据设定的显示顺序和显示时长，将每个目标图层作为前景图进行显示时，仅仅有部分文本呈现出颜色渐变效果，该目标图层中的其他文本依然保留原始的颜色属性，因此，在展示全部目标图层的过程中，不仅可以保

2023-07-25

754KB

文本的表达方法、装置、电子设备及可读存储介质.pdf

本申请公开了一种文本的表达方法、装置、电子设备及可读存储介质，涉及深度学习技术领域和自然语言处理技术领域。具体实现方案为：根据待表达文本的文本结构信息，获得待表达文本的图结构；利用结点表达模型，获得待表达文本的图结构中各结点的向量表达；根据待表达文本的图结构中各结点的向量表达，利用图结构表达模型，获得待表达文本的图结构的向量表达，以作为待表达文本的向量表达。由于充分考虑了文本的非线性特征所进行的图结构表达，使得所获得的文本表达在语义上能够很好地体现文本的结构信息，同时保留了重要的语义信息，使得所获得的文本

2023-11-13

642KB

文本语音转化方法、装置、电子设备及可读存储介质.pdf

本申请提供了一种文本语音转化方法、装置、电子设备及可读存储介质，其中，该方法包括：根据配置信息，为待处理文本配置目标语音属性，所述配置信息包括所述目标语音属性；获取语音数据库中所述待处理文本对应的音频文件；根据所述目标语音属性，播放所述音频文件。本申请通过为待处理文本配置相应的目标语音属性，使得通过语音属性实现对待处理文本的播放进行控制，以实现音频输出的声音富有人类情感，能够逼真的模拟人类的声音。

2023-07-25

430KB

文字图片的翻译方法、装置、电子设备及可读存储介质.pdf

本申请实施例提供了一种文字图片的翻译方法、装置、电子设备及可读存储介质，涉及文字图片翻译技术领域。该方法包括：在页面中的第一区域展示待翻译的第一文字图片；响应于针对第一文字图片中目标文字的擦除操作，在第一区域展示擦除目标文字后的第二文字图片；响应于针对第二文字图片的文本填充操作，将目标文字对应的翻译结果填充至第二文字图片中，获得并展示第三文字图片；其中，翻译结果在第三文字图片中的样式与目标文字在第一文字图片中的样式相同。本申请实施例在对文字图片进行翻译时，无需反复让译员和排版员反复进行沟通矫正，简化了文字

2023-07-24

540KB