预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共35页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115989682A(43)申请公布日2023.04.18(21)申请号202180052259.9(74)专利代理机构北京市金杜律师事务所(22)申请日2021.08.2011256专利代理师张维李春辉(30)优先权数据63/071,1492020.08.27US(51)Int.Cl.H04S3/00(2006.01)(85)PCT国际申请进入国家阶段日2023.02.23(86)PCT国际申请的申请数据PCT/US2021/0468102021.08.20(87)PCT国际申请的公布数据WO2022/046533EN2022.03.03(71)申请人苹果公司地址美国加利福尼亚州(72)发明人F·鲍姆加特权利要求书6页说明书13页附图15页(54)发明名称基于立体声的沉浸式编码(STIC)(57)摘要本发明公开了一种通过双声道立体声信号和方向参数表示沉浸式信号的音频编解码器,该双声道立体声信号是沉浸式信号的立体声渲染。这些方向参数可基于描述虚拟扬声器对的方向的感知模型来重新创建所感知的主导声音的地点。可使用时频拼贴在多个声道对的频域中对立体声信号执行解码器处的音频处理。音频信号的空间定位可使用平移方法,具体通过将加权应用于针对每个输出声道对的立体声信号的时频拼贴。针对时频拼贴的加权可基于方向参数、立体声信号的分析以及输出声道布局来导出。这些加权可用于使用去相关器自适应地处理时频拼贴,以减少或最小化由于空间渲染引起的频谱失真。CN115989682ACN115989682A权利要求书1/6页1.一种对音频内容进行编码的方法,所述方法包括:由编码设备从所述音频内容生成双声道立体声信号;由所述编码设备基于所述音频内容生成方向参数,所述方向参数描述虚拟扬声器对方向,以在多个频率子带中重新创建所述音频内容的感知的主导声音地点;以及通过通信声道或通过存储设备将所述双声道立体声信号和所述方向参数传送到解码器。2.根据权利要求1所述的方法,其中所述音频内容包括与扬声器布局相关联的多声道信号、多个音频对象或任意阶数的高保真度立体声响复制中的一者或多者。3.根据权利要求1所述的方法,其中生成所述方向参数包括:由所述编码设备将由与扬声器布局相关联的多声道信号提供的所述音频内容转换为所述音频内容的频域表示的多个子带;由所述编码设备基于与所述多声道信号相关联的所述扬声器布局,使用响度掩蔽模型来为所述多个子带中的每个子带确定所述音频内容的最大响度;以及由所述编码设备为所述多个子带中的每个子带生成具有所述音频内容的所述最大响度的所述虚拟扬声器对的方向作为所述音频内容的所感知的主导声音地点。4.根据权利要求1所述的方法,其中所述方向参数包括所述虚拟扬声器对相对于默认听者位置的方位角和仰角,用以为所述多个频率子带中的每个频率子带重新创建所感知的主导声音地点。5.根据权利要求1所述的方法,其中生成所述方向参数包括:由所述编码设备将由多个音频对象提供的所述音频内容渲染到一个或多个虚拟声道对以创建所述多个音频对象的图像;由所述编码设备确定由所述一个或多个虚拟声道对创建的所述多个音频对象的所述图像的最大响度;以及由所述编码设备生成创建所述图像的所述最大响度的所述虚拟扬声器对的方向作为所述音频内容的所感知的主导声音地点。6.根据权利要求1所述的方法,还包括:基于提供所述音频内容的多个音频源的布局,将所述音频内容划分为多个区段,其中从所述音频内容生成所述双声道立体声信号包括:生成分别对应于所述多个区段中的所述音频内容的多个双声道立体声信号;其中生成所述方向参数包括:生成分别对应于所述多个区段中的所述音频内容的多个方向参数,所述多个方向参数中的每个方向参数描述所述虚拟扬声器对的方向,以在多个频率子带中重新创建所述多个区段中的对应区段中的所述音频内容的所感知的主导声音地点,并且其中传送所述双声道立体声信号和所述方向参数:通过所述通信声道或通过所述存储设备将所述多个双声道立体声信号和所述多个方向参数传送到所述解码器。7.根据权利要求1所述的方法,还包括:分析所述双声道立体声信号以生成内容分析参数;以及将所述内容分析参数传送到所述解码器。2CN115989682A权利要求书2/6页8.根据权利要求7所述的方法,其中所述内容分析参数包括表示所述立体声信号的预测增益和起音强度的参数。9.一种被配置为对音频内容进行编码的系统,所述系统包括:存储器,所述存储器被配置为存储指令;处理器,所述处理器被耦接到所述存储器,并且被配置为执行存储在所述存储器中的所述指令以:从所述音频内容生成双声道立体声信号;基于所述音频内容生成方向参数,所述方向参数描述虚拟扬声器对方向,以在多个频率子带中重新创建所述音频内容的感知的主导声音地点;以及