预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103811023103811023A(43)申请公布日2014.05.21(21)申请号201310540742.9(22)申请日2013.11.05(30)优先权数据12306403.22012.11.13EP(71)申请人索尼公司地址日本东京申请人声学及音乐调配研究院(72)发明人光藤祐基何亚瑟(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人马景辉(51)Int.Cl.G10L25/18(2013.01)权权利要求书2页利要求书2页说明书18页说明书18页附图9页附图9页(54)发明名称音频处理装置以及音频处理方法(57)摘要本发明涉及音频处理装置和音频处理方法。一种音频处理装置,包括:分解单元,用于将通过对来自于多个通道的音频信号执行时间-频率变换而获得的频率信息分解为表示通道方向的特征的通道矩阵、表示频率方向的特征的频率矩阵和表示时间方向的特征的时间矩阵;以及提取单元,用于基于所述通道矩阵、所述频率矩阵和所述时间矩阵提取来自于任意指定方向的音频的频率信息。CN103811023ACN10382ACN103811023A权利要求书1/2页1.一种音频处理装置,包括:分解单元(62),用于将通过对来自于多个通道的音频信号执行时间-频率变换(61)而获得的频率信息分解为表示通道方向的特征的通道矩阵(Q)、表示频率方向的特征的频率矩阵(W)和表示时间方向的特征的时间矩阵(H);以及提取单元(64),用于基于所述通道矩阵(Q)、所述频率矩阵(W)和所述时间矩阵(H)提取来自于任意指定方向的音频的频率信息。2.根据权利要求1所述的音频处理装置,还包括:方向规定单元(63),用于基于表示所指定方向的方向信息及所述通道矩阵(Q)来获得规定与来自于所指定方向的音频相关的矩阵成分的方向规定信息;其中,所述提取单元(64)基于所述通道矩阵(Q)、所述频率矩阵(W)、所述时间矩阵(H)以及所述方向规定信息来提取来自于所指定方向的音频的频率信息。3.根据权利要求2所述的音频处理装置,其中,所述提取单元(64)通过使用由所述方向规定信息确定的放大因子放大所述频率信息,提取来自于所指定方向的音频的频率信息。4.根据权利要求3所述的音频处理装置,其中,所述提取单元(64)基于所述频率矩阵(W)或所述时间矩阵(H)的统计特征来改变所述放大因子。5.根据权利要求4所述的音频处理装置,其中,所述分解单元(62)假设所述频率信息是通道、频率和时间帧作为相应维度的三维张量,并且通过执行张量分解来将所述频率信息分解为所述通道矩阵(Q)、所述频率矩阵(W)和所述时间矩阵(H)。6.根据权利要求5所述的音频处理装置,其中,所述张量分解是非负张量分解。7.根据权利要求6所述的音频处理装置,还包括:频率-时间变换单元(65),用于通过对由所述提取单元(64)获得的、来自于所指定方向的音频的所述频率信息执行频率-时间变换,产生来自于多个通道的音频信号。8.根据权利要求1所述的音频处理装置,还包括:方向规定单元(63),用于基于表示所指定方向的方向信息和所述通道矩阵(Q)来获得规定与来自于所指定方向的音频相关的矩阵成分的方向规定信息;其中,基于所规定的方向规定信息来确定所述通道矩阵(Q)的初始值。9.一种音频处理方法,包括:将通过对来自于多个通道的音频信号执行时间-频率变换(S12)而获得的频率信息分解为表示通道方向的特征的通道矩阵(Q)、表示频率方向的特征的频率矩阵(W)和表示时间方向的特征的时间矩阵(H);以及基于所述通道矩阵(Q)、所述频率矩阵(W)和所述时间矩阵(H)提取(S16)来自于任意指定方向的音频的频率信息。10.一种使得计算机执行以下功能的程序:将通过对来自于多个通道的音频信号执行时间-频率变换(S12)而获得的频率信息分解为表示通道方向的特征的通道矩阵(Q)、表示频率方向的特征的频率矩阵(W)和表示时2CN103811023A权利要求书2/2页间方向的特征的时间矩阵(H);以及基于所述通道矩阵(Q)、所述频率矩阵(W)和所述时间矩阵(H)提取(S16)来自于任意指定方向的音频的频率信息。3CN103811023A说明书1/18页音频处理装置以及音频处理方法技术领域[0001]本发明涉及音频处理装置、方法和程序,特别涉及能够更容易地从期望方向上的声源提取音频的音频处理装置、方法和程序。背景技术[0002]现有技术可以将来自多个声源的音频输出分离为各个声源的音频。例如,已经提出了一种方法,即使在具有噪声影响的环境中,该方法通过分离来自多个混合音频信号的一个或多个声源信号并使用基于独立成分分析法的声源分离处理使他们受到二值掩码处理,来实