预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103871423103871423A(43)申请公布日2014.06.18(21)申请号201210541700.2(22)申请日2012.12.13(71)申请人上海八方视界网络科技有限公司地址200941上海市宝山区月罗路310号F东2-B228室(72)发明人王雷(74)专利代理机构上海申新律师事务所31272代理人袁亚军(51)Int.Cl.G10L21/028(2013.01)G10L19/032(2013.01)G10L15/06(2013.01)权权利要求书2页利要求书2页说明书6页说明书6页附图1页附图1页(54)发明名称一种基于NMF非负矩阵分解的音频分离方法(57)摘要本发明属于语音信号分解领域,具体涉及一种基于NMF非负矩阵分解的音频分离方法,包括辅助音乐语音区分模块和NMF非负矩阵分解模块,该方法通过引入NMF这一新的数学研究成果,结合语音音频与音乐音频的音频特征差异,可以较好地将混合的音频当中语音音频与音乐音频进行分离,从而得到较为清晰地音乐音频与语音音频,结合NMF方法与机器学习算法,可以非常高效的完成这一音频的分离工作。CN103871423ACN1038742ACN103871423A权利要求书1/2页1.一种基于NMF非负矩阵分解的音频分离方法,其包括辅助音乐语音区分模块和NMF非负矩阵分解模块,其特征在于:其方法为:所述的辅助音乐语音区分模块利用机器学习的方法通过提取大量的语音音乐音频的相关音频特征作为训练样本,通过SVM算法进行训练得到识别模型;所述的NMF非负矩阵分解模块利用NMF非负矩阵分解方法,通过对原音频信号矩阵进行迭代分解,直到分解结果达到代价函数与辅助区分模块的要求则停止。2.根据权利要求1所述的基于NMF非负矩阵分解的音频分离方法,其特征在于:所述的辅助音乐语音区分模块利用机器学习的方法步骤如下:(a)、需要采集大量的语音、音乐以及既非语音也非音乐的音频文件作为训练样本,从而得到相应的区分模型;(b)、提取音频特征中的静音帧率、高过零率帧比率、低能量帧率、谱通量以及和谐度五个音频量化特征构成每个音频的特征向量,作为及其学习训练的输入向量集;(c)、利用SVM算法对于步骤(b)中所得到的向量集进行建模,得到所需要的用以识别语音与音乐视频的识别模型。3.根据权利要求1所述的基于NMF非负矩阵分解的音频分离方法,其特征在于:所述的NMF非负矩阵分解模块利用NMF非负矩阵分解方法的步骤如下:(1)、首先,建立NMF非负矩阵分解的基本依据公式;(2)、而后,依据在盲状态模型构建出符合要求的欧几里得距离代价函数,即判断分解结束的主要条件;(3)、依据此代价函数与基本函数,会得到用以分解原信号矩阵的迭代公式,并依据迭代公式进行迭代分解;(4)、当每次迭代完成之后,将利用预先设定的JEcu1门限进行判别,若达到门限则提取两个矩阵的相应特征向量,利用之前得到的语音音乐模型进行是否为语音或者音乐的判断;若判断失败,则继续利用c中所述方法进行迭代分解;若判断成功则在判断其是否达到门限JEcu2,直到达到该门限时,停止迭代过程。4.根据权利3所述的基于NMF非负矩阵分解的音频分离方法,其特征在于:所述步骤(1)中,NMF非负矩阵分解的基本依据公式为:Y=Ys+Ym+V=AsXs+AmXm+V其中,Y∈RN×T为观察信号的幅度谱,A∈RN×B,X∈RB×T,V∈RN×T分别表示Y的基本矩阵、系数矩阵和误差残留矩阵;上标N,T,B分别表示频率点数、帧数和基本矩阵所含向量的维数;A,X均为非负矩阵,其各元素都大等于0;下表s与m则代表该矩阵属于语音音频的矩阵和音乐音频的矩阵。5.根据权利3所述的基于NMF非负矩阵分解的音频分离方法,其特征在于:所述步骤(2)中,欧几里得距离代价函数定义为:2JEcu=0.5||Y-AsXs+AmXm||F6.根据权利3所述的基于NMF非负矩阵分解的音频分离方法,其特征在于:所述步骤(3)中,分解原信号矩阵的迭代公式定义为:2CN103871423A权利要求书2/2页其中,,,,表示梯度下降学习的速率;在第一次迭代的时,利用某音乐音频的信号矩阵Am与某语音音频的信号矩阵As以及单位矩阵作为AsXs以及AmXm的初始矩阵。3CN103871423A说明书1/6页一种基于NMF非负矩阵分解的音频分离方法技术领域[0001]本发明涉及语音信号分解领域,具体涉及一种基于NMF非负矩阵分解的音频分离方法。背景技术[0002]当一段音频当中既混杂有背景的音乐音频,也有语音音频时,为了获取单一的语音音频或者音乐音频以便进行相应的编码、信息检索等工作,便需要利用相应的算法将混杂的音频分离为