语音处理方法、装置、电子设备和介质-豆柴文库

语音处理方法、装置、电子设备和介质.pdf

2023-07-22

10金币

1.2MB

29页

醉香****mm

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共29页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114974252A(43)申请公布日2022.08.30(21)申请号202210416742.7(22)申请日2022.04.20(71)申请人海信视像科技股份有限公司地址266555山东省青岛市经济技术开发区前湾港路218号(72)发明人马宏王敏殷腾龙(74)专利代理机构北京国之大铭知识产权代理事务所(普通合伙)11565专利代理师张平(51)Int.Cl.G10L15/26(2006.01)G10L15/08(2006.01)G10L17/14(2013.01)G06F40/194(2020.01)权利要求书2页说明书19页附图7页(54)发明名称语音处理方法、装置、电子设备和介质(57)摘要本公开涉及一种语音处理方法、装置、电子设备和介质，尤其涉及语音处理技术领域；其中，该方法包括：对语音数据进行识别，得到对应的目标识别文本与目标声纹特征；根据目标声纹特征确定目标用户；基于目标用户对应的纠错图谱，确定目标识别文本对应的目标信息，纠错图谱中包括：目标识别文本与目标信息的对应关系；获取目标识别文本与目标信息的相似度，若相似度超过预设阈值，则将目标识别文本修改为目标信息。本公开实施例能够对目标用户的语音数据进行修正，有利于提高纠错速度，提高用户的使用体验。CN114974252ACN114974252A权利要求书1/2页1.一种语音处理方法，其特征在于，所述方法包括：对语音数据进行识别，得到对应的目标识别文本与目标声纹特征；根据所述目标声纹特征确定目标用户；基于所述目标用户对应的纠错图谱，确定所述目标识别文本对应的目标信息，所述纠错图谱中包括：所述目标识别文本与所述目标信息的对应关系；获取所述目标识别文本与所述目标信息的相似度，若所述相似度超过预设阈值，则将所述目标识别文本修改为所述目标信息。2.根据权利要求1所述的方法，其特征在于，所述获取所述目标识别文本与所述目标信息的相似度，包括：基于所述纠错图谱，确定所述目标识别文本对应的路径信息；根据所述路径信息，确定所述目标识别文本与所述目标信息的相似度。3.根据权利要求2所述的方法，其特征在于，所述路径信息包括：所述目标识别文本在不同路径类型下分别对应的第一路径信息和第二路径信息；所述根据所述路径信息，确定所述目标识别文本与所述目标信息的相似度，包括：基于所述第一路径信息确定第一路径类型下对应的第一概率值，以及基于所述第二路径信息确定第二路径类型下对应的第二概率值；根据所述第一概率值和所述第二概率值，确定所述目标识别文本与所述目标信息的相似度。4.根据权利要求2所述的方法，其特征在于，所述路径信息包括：所述目标识别文本在对应的路径下各子节点表示的分词与所述目标识别文本的相关概率和所述各子节点表示的分词对应的权重因子；所述根据所述路径信息，确定所述目标识别文本与所述目标信息的相似度，包括：根据所述相关概率以及对应的权重因子，确定所述目标识别文本与所述目标信息的相似度。5.根据权利要求1所述的方法，其特征在于，还包括：获取与所述目标信息相关的语料信息中包含的第一分词以及与所述目标信息对应的标签信息中包含的第二分词；将所述目标信息作为中心节点，所述第一分词、所述第二分词以及生成信息作为子节点，所述中心节点与不同的子节点之间的第一关联关系作为所述中心节点与不同的子节点之间的边，各子节点之间的第二关联关系作为所述各子节点之间的边，建立所述纠错图谱。6.根据权利要求5所述的方法，其特征在于，还包括：根据所述第一分词的句法依存关系对应的频率，或者所述句法依存关系中核心关系对应的目标分词的词性频率，确定所述第一分词对应的概率；根据所述第二分词对应的初始权重和权重因子，确定所述第二分词对应的概率；基于所述第一分词对应的概率和所述第二分词对应的概率，分别确定所述纠错图谱中对应边的权重值。7.根据权利要求1‑6任一项所述的方法，其特征在于，还包括：若根据所述目标声纹特征确定用户为非目标用户，或者所述相似度不超过所述预设阈值，则对所述目标识别文本进行处理，得到对应的处理结果；2CN114974252A权利要求书2/2页基于所述处理结果，通过预设语音纠错方法对所述处理结果进行修改，得到修改后的文本。8.一种语音处理装置，其特征在于，所述装置包括：识别模块，用于对语音数据进行识别，得到对应的目标识别文本与目标声纹特征；第一确定模块，用于根据所述目标声纹特征确定目标用户；第二确定模块，用于基于所述目标用户对应的纠错图谱，确定所述目标识别文本对应的目标信息，所述纠错图谱中包括：所述目标识别文本与所述目标信息的对应关系；修改模块，用于获取所述目标识别文本与所述目标信息的相似度，若所述相似度超过预设阈值，则将所述目标识别文本修改为所述目标信息。9.

相关资料

语音处理方法、装置、电子设备和介质.pdf

本公开涉及一种语音处理方法、装置、电子设备和介质，尤其涉及语音处理技术领域；其中，该方法包括：对语音数据进行识别，得到对应的目标识别文本与目标声纹特征；根据目标声纹特征确定目标用户；基于目标用户对应的纠错图谱，确定目标识别文本对应的目标信息，纠错图谱中包括：目标识别文本与目标信息的对应关系；获取目标识别文本与目标信息的相似度，若相似度超过预设阈值，则将目标识别文本修改为目标信息。本公开实施例能够对目标用户的语音数据进行修正，有利于提高纠错速度，提高用户的使用体验。

2023-07-22

1.2MB

语音处理方法、装置、电子设备和介质.pdf

本公开公开了一种语音处理方法、装置、设备、介质和产品，涉及语音技术领域。语音处理方法包括：从针对多个对象的第一语音数据中，确定针对多个对象中目标对象的至少一个语音片段；基于至少一个语音片段，确定目标对象的声纹特征；基于目标对象的声纹特征，处理第二语音数据，得到第二语音数据中针对目标对象的语音识别结果。

2023-07-25

663KB

语音处理方法、装置、电子设备和存储介质.pdf

本公开提供了一种语音处理方法、装置、电子设备和存储介质，涉及计算机技术领域，具体涉及语音技术和深度学习等人工智能技术领域。具体实现方案为：获取原始语音；从原始语音中提取频谱图；获取语音合成模型，其中，语音合成模型包括第一生成子模型和第二生成子模型；调用第一生成子模型对频谱图进行处理，以生成频谱图的谐波结构；以及调用第二生成子模型对谐波结构和频谱图进行处理，以生成目标语音。由此，该方法具有合成音质较好，音色还原度高，发音稳定且计算量小等特点。

2023-07-25

702KB

语音处理方法、装置、电子设备以及介质.pdf

本公开提供了一种语音处理方法，包括：获取目标用户的第一语音数据，其中，第一语音数据的语言类别为第一语言类别，第一语音数据包括目标用户的语音特性；确定用于处理第一语音数据的处理方式，其中，处理方式包括将第一语音数据的语言类别由第一语言类别转换为第二语言类别，处理方式还包括处理第一语音数据时保留语音特性；以及基于处理方式处理第一语音数据，得到第二语音数据，其中，第二语音数据的语言类别为第二语言类别，第二语音数据包括语音特性。本公开还提供了一种语音处理装置、一种电子设备以及一种计算机可读存储介质。

2023-11-14

663KB

语音处理方法及装置、存储介质、电子设备.pdf

本公开属于语音克隆技术领域，涉及一种语音处理方法及装置、存储介质、电子设备。该方法包括：对目标视频进行分离得到音频轨道和视频轨道，并采集被模仿者的第一语音；提取第一语音的第一语音特征，并将第一语音特征和音频轨道中的第二语音输入音色转换模型，以将音频轨道中第二语音的音色从第二音色转换至第一音色；其中，第一音色与第一语音对应，第二音色与第二语音对应；将音色转换后的音频轨道与视频轨道合并，以得到具有被模仿者音色的目标视频。在本公开中，通过识别第二语音的音素，实现了任意第二语音的音色的转换。

2023-07-25

1.2MB