预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102137326A*(12)发明专利申请(10)申请公布号CN102137326A(43)申请公布日2011.07.27(21)申请号201010587796.7G10L11/02(2006.01)(22)申请日2009.04.17(30)优先权数据61/046,2712008.04.18US(62)分案原申请数据200980113136.02009.04.17(71)申请人杜比实验室特许公司地址美国加利福尼亚州(72)发明人汉内斯·米施(74)专利代理机构北京集佳知识产权代理有限公司11227代理人杜诚李春晖(51)Int.Cl.H04S3/00(2006.01)H04R5/04(2006.01)G10L21/02(2006.01)权利要求书3页说明书8页附图5页(54)发明名称用于保持多通道音频中的语音可听度的方法和设备(57)摘要在一个实施例中,本发明包括一种用于改进多通道音频信号中的语音的可听度的方法。该方法包括:对多通道音频信号的第一特征和第二特征进行比较以产生衰减因子。第一特征对应于多通道音频信号的包含语音音频和非语音音频的第一通道,第二特征对应于多通道音频信号的主要包含非语音音频的第二通道。该方法还包括:根据语音似然值调节衰减因子以产生经调节的衰减因子。该方法还包括:使用经调节的衰减因子对第二通道进行衰减。CN102376ACCNN110213732602137332A权利要求书1/3页1.一种用于改进多通道音频信号中的语音的可听度的方法,包括:对所述多通道音频信号的第一特征和第二特征进行比较以产生衰减因子,其中所述第一特征对应于所述多通道音频信号的包含语音音频和非语音音频的第一通道,其中所述第一特征对应于所述第一通道中的信号的第一功率谱,其中所述第二特征对应于所述多通道音频信号的主要包含非语音音频的第二通道,并且其中所述第二特征对应于所述第二通道中的信号的第二功率谱,其中对所述第一特征和所述第二特征进行比较包括:基于所述第一功率谱和所述第二功率谱执行可懂度预测以产生预测的可懂度;对应用于所述第二功率谱的增益进行调节,直到所述预测的可懂度满足标准为止;以及一旦所述预测的可懂度满足所述标准,使用经调节的所述增益作为所述衰减因子;根据语音似然值调节所述衰减因子以产生经调节的衰减因子;以及使用所述经调节的衰减因子对所述第二通道进行衰减。2.根据权利要求1所述的方法,还包括:处理所述多通道音频信号以产生所述第一特征和所述第二特征。3.根据权利要求1所述的方法,还包括:处理所述第一通道以产生所述语音似然值。4.根据权利要求1所述的方法,其中所述第二通道是多个第二通道之一,其中所述第二特征是多个第二特征之一,其中所述衰减因子是多个衰减因子之一,并且其中所述经调节的衰减因子是多个经调节的衰减因子之一,所述方法还包括:对所述第一特征和所述多个第二特征进行比较以产生所述多个衰减因子;根据所述语音似然值来调节所述多个衰减因子以产生所述多个经调节的衰减因子;以及使用所述多个经调节的衰减因子对所述多个第二通道进行衰减。5.根据权利要求1所述的方法,其中所述多通道音频信号包括第三通道,所述第三通道主要包含非语音音频,所述方法还包括:对所述第一特征和第三特征进行比较以产生附加衰减因子,其中所述第三特征对应于所述第三通道;根据所述语音似然值来调节所述附加衰减因子以产生经调节的附加衰减因子;以及使用所述经调节的衰减因子对所述第三通道进行衰减。6.根据权利要求1所述的方法,其中所述第二功率谱具有多个频带,其中对所述第一特征和所述第二特征进行比较还包括:基于所述第二功率谱执行响度计算以产生计算的响度;其中所述对增益进行调节的步骤还包括:对分别应用于所述第二功率谱的每个频带的多个增益进行调节,直到所述预测的可懂度满足可懂度标准并且所述计算的响度满足响度标准为止;并且其中所述使用所述增益的步骤包括:一旦所述预测的可懂度满足所述可懂度标准并且所述计算的响度满足所述响度标准,使用经调节的所述多个增益作为分别用于每个频带的所述衰减因子。7.一种设备,包括用于改进多通道音频信号中的语音的可听度的电路,所述设备包2CCNN110213732602137332A权利要求书2/3页括:比较电路,其被配置为对所述多通道音频信号的第一特征和第二特征进行比较以产生衰减因子,其中所述第一特征对应于所述多通道音频信号的包含语音音频和非语音音频的第一通道,其中所述第一特征对应于所述第一通道中的信号的第一功率谱,其中所述第二特征对应于所述多通道音频信号的主要包含非语音音频的第二通道,并且其中所述第二特征对应于所述第二通道中的信号的第二功率谱,其中所述比较电路包括:可懂度预测电路,其被配置为基于所述第一功率谱和所述第二功率谱执行可懂度预测