预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共78页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109616142A(43)申请公布日2019.04.12(21)申请号201910010064.2(51)Int.Cl.(22)申请日2014.03.25G10L25/81(2013.01)G10L21/02(2013.01)(30)优先权数据G10L17/06(2013.01)61/811,0622013.04.11US(66)本国优先权数据201310100367.62013.03.26CN(62)分案原申请数据201480018590.92014.03.25(71)申请人杜比实验室特许公司地址美国加利福尼亚(72)发明人芦烈A·J·希菲尔德王珺(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人宿小猛权利要求书1页说明书49页附图27页(54)发明名称用于音频分类和处理的装置和方法(57)摘要本公开涉及用于音频分类和处理的装置和方法。在一个实施例中,音频处理装置包括:音频分类器,用于实时地将音频信号分类为至少一种音频类型;音频改进设备,用于改进听众的体验;以及调整单元,用于基于所述至少一种音频类型的置信度值以连续的方式调整音频改进设备的至少一个参数。CN109616142ACN109616142A权利要求书1/1页1.一种音频分类器,包括:短期特征提取器,用于从短期音频段提取短期特征,每个短期音频段包括音频帧序列;短期分类器,用于使用相应的短期特征将长期音频段中的短期段序列分类为短期音频类型;统计提取器,用于计算短期分类器关于所述长期音频段中的短期段序列的结果的统计,作为长期特征;以及长期分类器,用于使用所述长期特征将所述长期音频段分类为长期音频类型。2.一种包括根据权利要求1所述的音频分类器的音频处理装置。3.一种音频分类方法,包括:从短期音频段提取短期特征,每个短期音频段包括音频帧序列;使用相应的短期特征将长期音频段中的短期段序列分类为短期音频类型;计算分类操作关于所述长期音频段中的短期段序列的结果的统计,作为长期特征;以及使用所述长期特征将所述长期音频段分类为长期音频类型。4.一种具有记录在其上的计算机程序指令的计算机可读介质,当被处理器执行时,所述指令使得处理器能够执行根据权利要求3所述的音频分类方法。5.一种音频分类设备,包括:处理器;以及具有记录在其上的计算机程序指令的计算机可读介质,当被处理器执行时,所述指令使得处理器能够执行根据权利要求3所述的音频分类方法。6.一种音频分类装置,包括用于执行根据权利要求3所述的音频分类方法的部件。2CN109616142A说明书1/49页用于音频分类和处理的装置和方法[0001]本申请是申请号为201480018590.9、申请日为2014年3月25日、发明名称为“用于音频分类和处理的装置和方法”的发明专利申请的分案申请。[0002]相关申请的交叉引用[0003]本申请要求2013年4月11日提交的美国临时专利申请No.61/811,062和2013年3月26日提交的中国优先权申请No.201310100367.6的优先权,这些申请的全部内容特此通过引用并入。技术领域[0004]本申请一般涉及音频信号处理。具体地说,本申请的实施例涉及用于音频分类和处理(尤其是对白增强器、环绕虚拟器、音量调节器(leveler)和均衡器的控制)的装置和方法。背景技术[0005]一些音频改进(improve)设备趋向于在时域或谱域中修改音频信号,以便改进音频的整体质量并且相应地增强用户的体验。各种音频改进设备已出于各种目的而被开发。音频改进设备的一些典型示例包括:[0006]对白增强器:对白是电影和无线电或TV节目中理解故事的最重要的组成部分。开发了增强对白以便增加它们的清晰度和它们的可懂度(尤其是对于听力能力下降的年长者)的方法。[0007]环绕虚拟器:环绕虚拟器使得环绕(多声道)声音信号能够通过PC的内部扬声器或者通过头戴式耳机而被呈现。也就是说,利用立体声设备(诸如扬声器和头戴式耳机),它虚拟地创建环绕效果,并且为消费者提供影片体验。[0008]音量调节器:音量调节器旨在基于目标响度值调谐回放中的音频内容的音量并且使它在时间线上保持几乎一致。[0009]均衡器:均衡器提供谱平衡(被称为“音调”或“音色”)的一致性,并且允许用户配置每单个频带上的频率响应(增益)的整体轮廓(曲线或形状),以便强调某些声音或者去除不希望的声音。在传统均衡器中,不同的均衡器预设(preset)可以针对不同的声音(诸如不同的音乐体裁(genre))提供。一旦预设被选择,或者均衡轮廓被设置,相同的均衡增益就将被施加于信号上,直到均衡轮廓被手动修改为止。相反,动态均衡器通过下述方式来实现谱平衡一致性,即,连续地监视音