预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109697985A(43)申请公布日2019.04.30(21)申请号201811593104.2(22)申请日2018.12.25(71)申请人广州市百果园信息技术有限公司地址511442广东省广州市番禺区南村镇万博二路79号万博商务区万达商业广场北区B-1栋(72)发明人李敬(74)专利代理机构北京市立方律师事务所11330代理人刘延喜(51)Int.Cl.G10L21/013(2013.01)权利要求书2页说明书10页附图6页(54)发明名称语音信号处理方法、装置及终端(57)摘要本发明提供语音信号处理方法,包括:依据设定帧长度对语音信号分帧得到帧信号,提取每帧帧信号的音频参数;语音信号包括第一语音信号和第二语音信号,音频参数对应第一音频参数和第二音频参数;将第一语音信号的帧信号与对第二语音信号的帧信号对齐匹配;将第一语音信号的帧信号的第一音频参数替换为匹配的第二语音信号的帧信号的第二音频参数,并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。本发明还提供语音信号处理装置和终端。本发明能实现生成特定声音的效果,生成后语音信号仍保留第一语音信号对应原说话人的音调、语速发音特点,兼具第二语音信号对应变声对象声音,克服不能针对特定对象变声和变声效果差的技术缺陷。CN109697985ACN109697985A权利要求书1/2页1.一种语音信号处理方法,其特征在于,包括如下步骤:依据设定帧长度对语音信号进行分帧得到帧信号,并提取每帧帧信号的音频参数;其中,所述语音信号包括第一语音信号和第二语音信号,所述音频参数对应为第一音频参数和第二音频参数;将第一语音信号的帧信号与对第二语音信号的帧信号进行语音信号对齐匹配;将第一语音信号的帧信号的第一音频参数替换为相匹配的第二语音信号的帧信号的第二音频参数,并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。2.根据权利要求1所述的语音信号处理方法,其特征在于,所述音频参数包括:基音频率、共振峰频谱包络和非周期激励信号。3.根据权利要求2所述的语音信号处理方法,其特征在于,所述依据设定帧长度对语音信号进行分帧得到帧信号,并提取每帧帧信号的音频参数的步骤,包括:依据设定帧长度对语音信号进行分帧得到帧信号;对每帧帧信号进行基音频率分析,得到对应每帧帧信号的基音频率;对每帧帧信号的波形和所述基音频率进行频谱包络分析,得到对应每帧帧信号的共振峰频谱包络;根据每帧帧信号的波形、基音频率以及共振峰频谱包络分析,得到对应每帧帧信号的非周期激励信号。4.根据权利要求3所述的语音信号处理方法,其特征在于,所述对每帧帧信号进行基音频率分析,得到对应每帧帧信号的基音频率的步骤包括:对每帧帧信号进行滤波获得若干候选基音频率及其周期;根据若干所述候选基音频率在不同周期间的零交点、峰值以及下降间隔,计算得到若干所述候选基音频率的置信度;选取置信度最高的候选基音频率作为该帧帧信号的基音频率。5.根据权利要求3所述的语音信号处理方法,其特征在于,所述对每帧帧信号的波形和所述基音频率进行频谱包络分析,得到对应每帧帧信号的共振峰频谱包络的步骤包括:根据每帧帧信号的波形和基音频率对应的周期,对语音信号进行汉明窗分割得到时域信号;对所述时域信号进行傅里叶变换得到功率谱;截取所述功率谱的高峰部分得到共振峰频谱包络。6.根据权利要求1所述的语音信号处理方法,其特征在于,所述将第一语音信号的帧信号与对第二语音信号的帧信号进行语音信号对齐匹配的步骤包括:对第一语音信号的帧信号和第二语音信号的帧信号分别进行梅尔频率倒谱分析,得到每帧帧信号对应的梅尔频率倒谱系数;对第一语音信号的帧信号和第二语音信号的帧信号,根据梅尔频率倒谱系数和动态时间规整对齐匹配。7.根据权利要求6所述的语音信号处理方法,其特征在于,所述对第一语音信号的帧信号和第二语音信号的帧信号分别进行梅尔频率倒谱分析,得到每帧帧信号对应的梅尔频率倒谱系数的步骤,包括:对第一语音信号的帧信号和第二语音信号的帧信号进行高通滤波得到预加重的帧信2CN109697985A权利要求书2/2页号;对所述预加重的帧信号进行加窗处理得到具有连续性的加窗帧信号;对所述加窗帧信号进行傅里叶变换得到每帧帧信号的能量频谱;将所述每帧帧信号的能量频谱通过三角形滤波器得到每帧帧信号对应的对数能量值;根据离散余弦变换将所述对数能量值转换为梅尔频率倒谱系数。8.根据权利要求6所述的语音信号处理方法,其特征在于,所述对第一语音信号的帧信号和第二语音信号的帧信号,根据梅尔频率倒谱系数和动态时间规整对齐匹配的步骤,包括:根据第一语音信号的帧信号和第二语音信号的帧信号的梅尔频率倒谱系数之间的欧氏距离最小的匹配条件,将第一语音信号和