预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共39页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN103325386A*(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103325386103325386A(43)申请公布日2013.09.25(21)申请号201210080977.X(22)申请日2012.03.23(71)申请人杜比实验室特许公司地址美国加利福尼亚州(72)发明人格伦·N·迪金森双志伟大卫·古纳万孙学京(74)专利代理机构北京集佳知识产权代理有限公司11227代理人杜诚李春晖(51)Int.Cl.G10L25/78(2013.01)权权利要求书6页利要求书6页说明书22页说明书22页附图10页附图10页(54)发明名称用于信号传输控制的方法和系统(57)摘要描述了用于信号传输控制的方法和系统。接收或访问具有块或帧的时间序列的音频信号。特征被确定为合起来表征相对于当前时间最近已经处理的顺序音频块/帧。特征确定超过特异度标准,并且相对于最近处理的音频块/帧被延迟。在音频信号中检测语音活动指示。VAD基于一个判决并且涉及当前块/帧特征,该判决超过预设灵敏度阈值,并且在相对于块/帧时长的短时间段上计算而得。VAD和最近特征确定与状态相关信息进行组合,所述信息基于从多个特征中收集、在最近特征确定时间段之前的时间确定的先前特征确定的历史。基于所述组合输出有关开始或终止所述音频信号的判决,或相关的增益。CN103325386ACN1032586ACN103325386A权利要求书1/6页1.一种方法,包括:接收或访问音频信号,所述音频信号包括多个时间上顺序的块或帧;确定两个或更多特征,所述特征合起来表征先前在相对于当前时间点最近的时间段内已经处理的所述顺序音频块或帧中的两个或更多个,其中所述特征确定超过特异度标准,并且相对于最近处理的音频块或帧被延迟;检测所述音频信号中语音活动的指示,其中所述语音活动检测(VAD)基于一个判决,所述判决超过预设的灵敏度阈值并且在一个时间段上计算而得,所述时间段相对于每个所述音频信号块或帧的时长而言是短的,其中所述判决涉及当前音频信号块或帧的一个或更多个特征;组合所述高灵敏度短期VAD、所述最近高特异度音频块或帧特征确定和涉及状态的信息,所述信息基于一个或更多个先前计算的特征确定的历史,所述特征确定是从在所述最近高特异度音频块或帧特征确定时间段之前的时间确定的多个特征中收集的;以及基于所述组合输出有关所述音频信号的开始或终止的判决,或与之相关的增益。2.如权利要求1所述的方法,其中所述组合步骤还包括组合与一个特征有关的一个或更多个信号或确定,该特征包括所述音频信号的当前或先前处理的特征。3.如权利要求1所述的方法,其中所述状态涉及烦扰特征或音频信号中的语音内容与音频信号的总音频内容的比值中的一个或更多个。4.如权利要求1所述的方法,其中所述组合步骤还包括组合涉及远端装置或音频环境的信息,所述远端装置或音频环境与正执行所述方法的装置通信耦合。5.如权利要求1所述的方法,还包括:分析所确定的表征最近处理的音频块或帧的特征;基于所确定的特征的分析,推断所述最近处理的音频块或帧包含至少一个非期望的时间信号分段;以及基于非期望信号分段推断来测量烦扰特征。6.如权利要求5所述的方法,其中所测量的烦扰特征是变化的。7.如权利要求6所述的方法,其中所测量的烦扰特征是单调变化的。8.如权利要求5、6或7中的一个或更多个所述的方法,其中所述高特异度先前音频块或帧特征确定包括期望语音内容相对于非期望时间信号分段的比值或主导程度中的一个或更多个。9.如权利要求5、6、7或8中的一个或更多个所述的方法,还包括计算涉及所述期望语音内容相对于所述非期望时间信号分段的比值或主导程度的移动统计数据。10.如权利要求5所述的方法,还包括:确定一个或更多个特征,所述特征识别两个或更多个所述先前处理的顺序音频块或帧的聚集上的烦扰特征;其中所述烦扰测量进一步基于所述烦扰特征识别。11.如权利要求1所述的方法,还包括:控制增益应用;以及基于所述增益应用控制,平滑所述期望时间音频信号分段开始或终止。12.如权利要求11所述的方法,其中:2CN103325386A权利要求书2/6页所述平滑期望时间音频信号分段开始包括渐强;以及所述平滑期望时间音频信号分段终止包括渐弱。13.如权利要求3或引用权利要求6的权利要求7中的一个或更多个所述的方法,还包括基于所测量的烦扰特征来控制增益水平。14.一种设备,包括:输入单元,被配置成接收或访问音频信号,所述音频信号包括多个时间上顺序的块或帧;特征生成器,被配置成确定两个或更多特征,所述特征合起来表征先前在相对于当前时间点最近的时间段内已经处理的所述顺序音频块或帧中的两个或更多个,其中所述特征确定超过特异度标准,并且相对于最近处理的音频块或