预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共60页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN104282315104282315A(43)申请公布日2015.01.14(21)申请号201310274580.9(22)申请日2013.07.02(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人许丽净(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人刘芳(51)Int.Cl.G10L21/028(2013.01)权权利要求书12页利要求书12页说明书37页说明书37页附图10页附图10页(54)发明名称音频信号分类处理方法、装置及设备(57)摘要本发明提供一种音频信号分类处理方法、装置及设备,其中方法包括:获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述音频信号中待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项;根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项,确定所述音频信号中待分类帧为音乐信号,或确定所述音频信号中待分类帧为语音信号。本发明提供的技术方案,能够提高音频信号的分类正确率。CN104282315ACN1042835ACN104282315A权利要求书1/12页1.一种音频信号分类处理方法,其特征在于,包括:获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项;根据获取的所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项,确定所述音频信号中待分类帧为音乐信号,或确定所述音频信号中待分类帧为语音信号。2.根据权利要求1所述的音频信号分类处理方法,其特征在于,所述获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量包括:获取音频信号中待分类帧的音调分布参数,以及待分类帧前N1帧的音调分布参数,并根据所述待分类帧的音调分布参数,以及待分类帧前N1帧的音调分布参数获取待分类帧中满足连续性约束条件的音调分量的数量,N1为正整数;所述获取所述音频信号中待分类帧在低频区域的持续帧数和/或所述待分类帧在高频区域的持续帧数包括:获取所述音频信号中待分类帧的能量分布参数,以及待分类帧前N1帧的能量分布参数,并根据所述音频信号中待分类帧的能量分布参数,以及待分类帧前N1帧的能量分布参数获取所述待分类帧在低频区域的持续帧数和/或所述待分类帧在高频区域的持续帧数,N1为正整数;所述根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项,确定所述音频信号中待分类帧为音乐信号,否则确定所述音频信号中待分类帧为语音信号包括:在所述待分类帧中满足连续性约束条件的音调分量的数量大于第一阈值、所述待分类帧在低频区域的持续帧数大于第二阈值或所述待分类帧在高频区域的持续帧数大于第三阈值时,确定所述音频信号中待分类帧为音乐信号,否则确定所述音频信号中待分类帧为语音信号。3.根据权利要求2所述的音频信号分类处理方法,其特征在于,所述获取音频信号中待分类帧的音调分布参数,以及待分类帧前N1帧的音调分布参数包括:对接收到的音频信号中的待分类帧和待分类帧前N1帧进行快速傅里叶变换,获取功率密度谱;根据所述功率密度谱获取所述接收到的音频信号中的待分类帧的音调分量的频域分布信息作为待分类帧的音调分布参数,以及待分类帧前N1帧的音调分量的频域分布信息作为待分类帧前N1帧的音调分布参数;所述根据待分类帧的音调分布参数,以及待分类帧前N1帧的音调分布参数获取待分类帧中满足连续性约束条件的音调分量的数量包括:根据接收到的音频信号中的待分类帧和待分类帧前N1帧的音调分量的频域分布信息获取待分类帧中持续帧数大于第六阈值的音调分量的数量。4.根据权利要求2所述的音频信号分类处理方法,其特征在于,所述获取所述音频信号中待分类帧的能量分布参数,以及待分类帧前N1帧的能量分布参数包括:获取接收到的音频信号中待分类帧的高频能量分布比和声压级作为待分类帧的能量分布参数,以及待分类帧前N1帧的高频能量分布比和声压级作为待分类帧前N1帧的能量2CN104282315A权利要求书2/12页分布参数;所述根据音频信号中待分类帧的能量分布参数,以及待分类帧前N1帧的能量分布参数获取所述待分类帧在低频区域的持续帧数包括:根据所述接收到的音频信号中待分类帧和待分类帧前N1帧的高频能量分布比和声压级获取包括所述待分类帧在内的高频能量分布比小于第八阈值的持续帧数;所述根据音