音频信号分类处理方法、装置及设备-豆柴文库

音频信号分类处理方法、装置及设备.pdf

2023-12-07

10金币

10.5MB

60页

书生****专家

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共60页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN104282315104282315A(43)申请公布日2015.01.14(21)申请号201310274580.9(22)申请日2013.07.02(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人许丽净(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人刘芳(51)Int.Cl.G10L21/028(2013.01)权权利要求书12页利要求书12页说明书37页说明书37页附图10页附图10页(54)发明名称音频信号分类处理方法、装置及设备(57)摘要本发明提供一种音频信号分类处理方法、装置及设备，其中方法包括：获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述音频信号中待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项；根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项，确定所述音频信号中待分类帧为音乐信号，或确定所述音频信号中待分类帧为语音信号。本发明提供的技术方案，能够提高音频信号的分类正确率。CN104282315ACN1042835ACN104282315A权利要求书1/12页1.一种音频信号分类处理方法，其特征在于，包括：获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项；根据获取的所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项，确定所述音频信号中待分类帧为音乐信号，或确定所述音频信号中待分类帧为语音信号。2.根据权利要求1所述的音频信号分类处理方法，其特征在于，所述获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量包括：获取音频信号中待分类帧的音调分布参数，以及待分类帧前N1帧的音调分布参数，并根据所述待分类帧的音调分布参数，以及待分类帧前N1帧的音调分布参数获取待分类帧中满足连续性约束条件的音调分量的数量，N1为正整数；所述获取所述音频信号中待分类帧在低频区域的持续帧数和/或所述待分类帧在高频区域的持续帧数包括：获取所述音频信号中待分类帧的能量分布参数，以及待分类帧前N1帧的能量分布参数，并根据所述音频信号中待分类帧的能量分布参数，以及待分类帧前N1帧的能量分布参数获取所述待分类帧在低频区域的持续帧数和/或所述待分类帧在高频区域的持续帧数，N1为正整数；所述根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项，确定所述音频信号中待分类帧为音乐信号，否则确定所述音频信号中待分类帧为语音信号包括：在所述待分类帧中满足连续性约束条件的音调分量的数量大于第一阈值、所述待分类帧在低频区域的持续帧数大于第二阈值或所述待分类帧在高频区域的持续帧数大于第三阈值时，确定所述音频信号中待分类帧为音乐信号，否则确定所述音频信号中待分类帧为语音信号。3.根据权利要求2所述的音频信号分类处理方法，其特征在于，所述获取音频信号中待分类帧的音调分布参数，以及待分类帧前N1帧的音调分布参数包括：对接收到的音频信号中的待分类帧和待分类帧前N1帧进行快速傅里叶变换，获取功率密度谱；根据所述功率密度谱获取所述接收到的音频信号中的待分类帧的音调分量的频域分布信息作为待分类帧的音调分布参数，以及待分类帧前N1帧的音调分量的频域分布信息作为待分类帧前N1帧的音调分布参数；所述根据待分类帧的音调分布参数，以及待分类帧前N1帧的音调分布参数获取待分类帧中满足连续性约束条件的音调分量的数量包括：根据接收到的音频信号中的待分类帧和待分类帧前N1帧的音调分量的频域分布信息获取待分类帧中持续帧数大于第六阈值的音调分量的数量。4.根据权利要求2所述的音频信号分类处理方法，其特征在于，所述获取所述音频信号中待分类帧的能量分布参数，以及待分类帧前N1帧的能量分布参数包括：获取接收到的音频信号中待分类帧的高频能量分布比和声压级作为待分类帧的能量分布参数，以及待分类帧前N1帧的高频能量分布比和声压级作为待分类帧前N1帧的能量2CN104282315A权利要求书2/12页分布参数；所述根据音频信号中待分类帧的能量分布参数，以及待分类帧前N1帧的能量分布参数获取所述待分类帧在低频区域的持续帧数包括：根据所述接收到的音频信号中待分类帧和待分类帧前N1帧的高频能量分布比和声压级获取包括所述待分类帧在内的高频能量分布比小于第八阈值的持续帧数；所述根据音

相关资料

音频信号分类处理方法、装置及设备.pdf

本发明提供一种音频信号分类处理方法、装置及设备，其中方法包括：获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述音频信号中待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项；根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项，确定所述音频信号中待分类帧为音乐信号，或确定所述音频信号中待分类帧为语音信号。本发明提供的技术方案，能够提高音频信号的分类正确率。

2023-12-07

10.5MB

音频信号处理方法、音频信号处理装置及存储介质.pdf

本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括：获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值，基于直达声和早期反射声的协方差矩阵估计更新值，对观测数据进行去混响处理，得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值，对多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。通过本公开提供的音频信号处理方法，能够基于盲源分离算法，获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵，进而进行盲源分离得到各音频

2023-06-27

1.2MB

音频信号处理方法及装置.pdf

本申请提供了一种音频信号处理方法及装置，该方法采用基于神经网络的人声提取模型，从原始立体声信号中提取出左、右声道背景声信号和人声信号。对左、右声道背景声信号进行声场扩展得到扩展背景声信号；进一步，对人声信号进行语音检测获得目标人声信号。最后，对扩展背景声信号和目标人声信号进行混音处理，得到目标输出音频信号。可见，基于神经网络的人声提取模型能够提取出比较纯净的人声信号，从而获得比较纯净的背景声信号，对纯净的背景声信号进行声场扩展，避免了人声变散变虚的问题，提高了声场扩展效果。而且，提高了人声清晰度和声场扩展

2023-07-24

696KB

音频信号处理方法及装置.pdf

本公开涉及空间音频技术领域,具体涉及一种音频信号处理方法及装置。一种音频信号处理方法,包括:获取穿戴设备发生转动时的第一转动信息以及与所述穿戴设备连接的移动设备发生转动时的第二转动信息;根据所述第一转动信息和所述第二转动信息,确定所述穿戴设备与所述移动设备的相对位置信息;根据所述相对位置信息对音频信号处理得到由所述穿戴设备播放的播放音频。本公开实施方式方法提高空间音频效果。

2023-04-18

715KB

音频信号的处理方法、装置、设备及存储介质.pdf

本申请公开了一种音频信号的处理方法、装置、设备及存储介质,该方法包括根据在安静状态下扬声器播放的激励信号,确定预先测量回声的第一协方差矩阵,然后获取多个麦克风采集到的多个含有回声的第一音频信号,和扬声器内传输的参考信号,根据参考信号对多个第一音频信号进行自适应滤波处理,得到多个自适应滤波处理后的第二音频信号,根据预先测量回声的第一协方差矩阵的逆矩阵,对多个第二音频信号进行波束成形处理,得到一个波束成形处理后的第三音频信号,对第三音频信号进行噪声消除处理,得到消除噪声后的目标音频信号,采用本发明实施例,能够

2023-04-19

941KB