预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109300484A(43)申请公布日2019.02.01(21)申请号201811066717.0(22)申请日2018.09.13(71)申请人广州酷狗计算机科技有限公司地址510660广东省广州市天河区黄埔大道中315号自编1-17(72)发明人劳振锋(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人郭晶(51)Int.Cl.G10L25/18(2013.01)G10L25/24(2013.01)G10L25/51(2013.01)G10L25/90(2013.01)权利要求书3页说明书9页附图3页(54)发明名称音频对齐方法、装置、计算机设备以及可读存储介质(57)摘要本发明公开了一种音频对齐方法、装置、计算机设备以及可读存储介质,属于音频处理技术领域。本发明基于第一音频的第一非周期参数和第一能量参数在第一梅尔频谱上确定出第一目标频谱范围,将第一梅尔倒谱参数对应于第一目标频谱范围的倒谱参数处理,便可得到能够实现对齐的第三梅尔倒谱参数,基于同样方法得到第四梅尔倒谱参数,从而节省确定每个音频的单音或和弦的起始时间,再提取每一个单音或和弦的特征值构建特征值矩阵的步骤,进而采用DTW算法对第三梅尔倒谱参数和第四梅尔倒谱参数进行对齐,从而减少了计算量,减少了时间。CN109300484ACN109300484A权利要求书1/3页1.一种音频对齐方法,其特征在于,所述方法包括:获取第一音频的第一梅尔频谱和第二音频的第二梅尔频谱;提取所述第一梅尔频谱的第一梅尔倒谱参数、第一非周期参数和第一能量参数,提取所述第二梅尔频谱的第二梅尔倒谱参数、第二非周期参数和第二能量参数,所述第一音频和所述第二音频对应于相同的内容;基于所述第一非周期参数和所述第一能量参数,在所述第一梅尔频谱上确定第一目标频谱范围,所述第一目标频谱范围内的所述第一非周期参数大于预设非周期参数值,所述第一目标频谱范围内的所述第一能量参数小于预设能量参数值;基于所述第二非周期参数和所述第二能量参数,在所述第二梅尔频谱上确定第二目标频谱范围,所述第二目标频谱范围内的所述第二非周期参数大于所述预设非周期参数值,所述第二目标频谱范围内的所述第二能量参数小于所述预设能量参数值;将所述第一梅尔倒谱参数对应于所述第一目标频谱范围的倒谱参数置0,得到第三梅尔倒谱参数;将所述第二梅尔倒谱参数对应于所述第二目标频谱范围的倒谱参数置0,得到第四梅尔倒谱参数;将所述第三梅尔倒谱参数和所述第四梅尔倒谱参数进行对齐;基于所述第三梅尔倒谱参数和所述第四梅尔倒谱参数进行对齐的路径,对齐所述第一梅尔频谱和所述第二梅尔频谱。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一非周期参数和所述第一能量参数,在所述第一梅尔频谱上确定第一目标频谱范围包括:获取第一非周期参数集合,将所述第一非周期参数集合对应到所述第一梅尔频谱,得到第一频谱范围,所述第一非周期参数集合包括所述多个大于所述预设非周期参数值的所述第一非周期参数;获取第一能量参数集合,将所述第一能量参数集合对应到所述第一梅尔频谱,得到第二频谱范围,所述第一能量参数集合包括所述多个小于所述预设能量参数值的所述第一能量参数;获取所述第一目标频谱范围,所述第一目标频谱范围为所述第一频谱范围和所述第二频谱范围的并集。3.根据权利要求1所述的方法,其特征在于,所述提取所述第一梅尔频谱的第一梅尔倒谱参数包括以下步骤:对所述第一音频进行预加重、分帧和加汉明窗处理;将处理过的所述第一音频进行快速傅里叶变换,得到所述第一音频的每一帧的频谱;将所述每一帧的频谱输入梅尔滤波器,得到所述第一梅尔频谱;基于所述第一梅尔频谱进行倒谱运算,得到所述第一梅尔倒谱参数。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一梅尔频谱进行倒谱运算,得到所述第一梅尔倒谱参数包括:对所述第一梅尔频谱进行取对数处理;将取对数处理后的所述第一梅尔频谱进行离散余弦变换,得到所述第一梅尔倒谱参数。2CN109300484A权利要求书2/3页5.根据权利要求1所述的方法,其特征在于,所述将所述第三梅尔倒谱参数和所述第四梅尔倒谱参数进行对齐包括:采用动态时轴规整算法,求出对齐所述第三梅尔倒谱参数和所述第四梅尔倒谱参数的目标路径;基于所述目标路径,对所述第三梅尔倒谱参数和所述第四梅尔倒谱参数进行对齐。6.根据权利要求1所述的方法,其特征在于,所述第一梅尔倒谱参数和所述第二梅尔倒谱参数的维数为25维。7.根据权利要求1所述的方法,其特征在于,所述第一非周期参数、所述第二非周期参数、所述第一能量参数和所述第二能量参数的维数为1维。8.根据权利要求1所述的方法,其特征在于,所述第一非周期参数是所述第一音频中辅