预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110956971A(43)申请公布日2020.04.03(21)申请号201911219026.4G10L25/51(2013.01)(22)申请日2019.12.03G10L17/02(2013.01)(71)申请人广州酷狗计算机科技有限公司地址510660广东省广州市天河区黄埔大道中315号自编1-17(72)发明人黄中一(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人邢惠童(51)Int.Cl.G10L21/013(2013.01)G10L25/15(2013.01)G10L25/18(2013.01)G10L25/24(2013.01)G10L25/30(2013.01)权利要求书2页说明书11页附图5页(54)发明名称音频处理方法、装置、终端及存储介质(57)摘要本发明公开了一种音频处理方法、装置、终端及存储介质,属于音频处理技术领域。所述方法包括:通过提取第一音频的第一音色特征,基于该第一音色特征,筛选出相近的目标音频,基于目标音频的目标音色特征,将第一音频转换为融合有目标音色特征和第一音色特征的第二音频,从而对音频的音色进行了改变,丰富了音频处理过程。且梅尔频谱影响了音频的磁性程度、基频微扰、振幅微扰等多种特性,因此,第二音频融合了第一音频和目标音频的梅尔频谱等音色特征,使得处理之后的音频在音色上有进一步的美化,提高了音频处理之后得到的音频的真实性。CN110956971ACN110956971A权利要求书1/2页1.一种音频处理方法,其特征在于,所述方法包括:当接收到音频处理指令时,获取待处理的第一音频;从所述第一音频中提取所述第一音频的第一音色特征,所述第一音色特征至少包括所述第一音频的梅尔频谱;基于所述第一音频的第一音色特征,从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频;基于所述目标音频的目标音色特征,将所述第一音频转换为第二音频,所述第二音频融合所述目标音频的目标音色特征和所述第一音色特征。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标音频的目标音色特征,将所述第一音频转换为第二音频包括:获取声音美化度,所述声音美化度用于指示所述第二音频与所述目标音频的相似程度;将所述声音美化度、所述第一音色特征、所述目标音色特征和所述第一音频输入目标模型,输出所述第二音频,所述目标模型用于将原音频转换为融合有目标音频的目标音色特征的另一音频。3.根据权利要求2所述的方法,其特征在于,所述获取声音美化度包括以下任一项:在第一音频采集过程中,获取用户输入的声音美化度,将所述声音美化度作为所述声音美化度;获取所述用户的历史美化度,将所述历史美化度作为所述声音美化度;获取系统默认美化度,将所述系统默认美化度作为所述声音美化度。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一音频的第一音色特征,从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频包括:根据所述第一音频的第一音色特征和所述多个备选音频的备选音色特征,从多个备选音频中筛选出与所述第一音频之间的相似度超过目标阈值的多个第三音频;在目标应用的应用界面上显示所述多个第三音频的音频标识;基于所述多个第三音频的音频标识中被选中的目标音频标识,确定出所述多个第三音频中的目标音频。5.根据权利要求1所述的方法,其特征在于,所述第一音色特征还包括所述第一音频的基频、共振峰、谐波、梅尔倒谱系数、能量、过零率中的至少一项。6.一种音频处理装置,其特征在于,所述装置包括:获取模块,用于当接收到音频处理指令时,获取待处理的第一音频;提取模块,用于从所述第一音频中提取所述第一音频的第一音色特征,所述第一音色特征至少包括所述第一音频的梅尔频谱;确定模块,用于基于所述第一音频的第一音色特征,从多个备选音频中确定与所述第一音频之间相似度满足筛选条件的目标音频;转化模块,用于基于所述目标音频的目标音色特征,将所述第一音频转换为第二音频,所述第二音频融合所述目标音频的目标音色特征和所述第一音色特征。7.根据权利要求6所述的装置,其特征在于,所述转化模块,还用于获取声音美化度,所述声音美化度用于指示所述第二音频与所2CN110956971A权利要求书2/2页述目标音频的相似程度;将所述声音美化度、所述第一音色特征、所述目标音色特征和所述第一音频输入目标模型,输出所述第二音频,所述目标模型用于将原音频转换为融合有目标音频的目标音色特征的另一音频。8.根据权利要求7所述的装置,其特征在于,所述转化模块,还用于以下任一项:在第一音频采集过程中,获取用户输入的声音美化度,将所述声音美化度作为所述声音美化度;获取所述用户的历史美化度,将所述历史美化度作为