基于立体声的沉浸式编码（STIC）-豆柴文库

基于立体声的沉浸式编码（STIC）.pdf

2024-01-06

10金币

3MB

35页

增梅****主啊

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共35页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115989682A(43)申请公布日2023.04.18(21)申请号202180052259.9(74)专利代理机构北京市金杜律师事务所(22)申请日2021.08.2011256专利代理师张维李春辉(30)优先权数据63/071,1492020.08.27US(51)Int.Cl.H04S3/00(2006.01)(85)PCT国际申请进入国家阶段日2023.02.23(86)PCT国际申请的申请数据PCT/US2021/0468102021.08.20(87)PCT国际申请的公布数据WO2022/046533EN2022.03.03(71)申请人苹果公司地址美国加利福尼亚州(72)发明人F·鲍姆加特权利要求书6页说明书13页附图15页(54)发明名称基于立体声的沉浸式编码（STIC）(57)摘要本发明公开了一种通过双声道立体声信号和方向参数表示沉浸式信号的音频编解码器，该双声道立体声信号是沉浸式信号的立体声渲染。这些方向参数可基于描述虚拟扬声器对的方向的感知模型来重新创建所感知的主导声音的地点。可使用时频拼贴在多个声道对的频域中对立体声信号执行解码器处的音频处理。音频信号的空间定位可使用平移方法，具体通过将加权应用于针对每个输出声道对的立体声信号的时频拼贴。针对时频拼贴的加权可基于方向参数、立体声信号的分析以及输出声道布局来导出。这些加权可用于使用去相关器自适应地处理时频拼贴，以减少或最小化由于空间渲染引起的频谱失真。CN115989682ACN115989682A权利要求书1/6页1.一种对音频内容进行编码的方法，所述方法包括：由编码设备从所述音频内容生成双声道立体声信号；由所述编码设备基于所述音频内容生成方向参数，所述方向参数描述虚拟扬声器对方向，以在多个频率子带中重新创建所述音频内容的感知的主导声音地点；以及通过通信声道或通过存储设备将所述双声道立体声信号和所述方向参数传送到解码器。2.根据权利要求1所述的方法，其中所述音频内容包括与扬声器布局相关联的多声道信号、多个音频对象或任意阶数的高保真度立体声响复制中的一者或多者。3.根据权利要求1所述的方法，其中生成所述方向参数包括：由所述编码设备将由与扬声器布局相关联的多声道信号提供的所述音频内容转换为所述音频内容的频域表示的多个子带；由所述编码设备基于与所述多声道信号相关联的所述扬声器布局，使用响度掩蔽模型来为所述多个子带中的每个子带确定所述音频内容的最大响度；以及由所述编码设备为所述多个子带中的每个子带生成具有所述音频内容的所述最大响度的所述虚拟扬声器对的方向作为所述音频内容的所感知的主导声音地点。4.根据权利要求1所述的方法，其中所述方向参数包括所述虚拟扬声器对相对于默认听者位置的方位角和仰角，用以为所述多个频率子带中的每个频率子带重新创建所感知的主导声音地点。5.根据权利要求1所述的方法，其中生成所述方向参数包括：由所述编码设备将由多个音频对象提供的所述音频内容渲染到一个或多个虚拟声道对以创建所述多个音频对象的图像；由所述编码设备确定由所述一个或多个虚拟声道对创建的所述多个音频对象的所述图像的最大响度；以及由所述编码设备生成创建所述图像的所述最大响度的所述虚拟扬声器对的方向作为所述音频内容的所感知的主导声音地点。6.根据权利要求1所述的方法，还包括：基于提供所述音频内容的多个音频源的布局，将所述音频内容划分为多个区段，其中从所述音频内容生成所述双声道立体声信号包括：生成分别对应于所述多个区段中的所述音频内容的多个双声道立体声信号；其中生成所述方向参数包括：生成分别对应于所述多个区段中的所述音频内容的多个方向参数，所述多个方向参数中的每个方向参数描述所述虚拟扬声器对的方向，以在多个频率子带中重新创建所述多个区段中的对应区段中的所述音频内容的所感知的主导声音地点，并且其中传送所述双声道立体声信号和所述方向参数：通过所述通信声道或通过所述存储设备将所述多个双声道立体声信号和所述多个方向参数传送到所述解码器。7.根据权利要求1所述的方法，还包括：分析所述双声道立体声信号以生成内容分析参数；以及将所述内容分析参数传送到所述解码器。2CN115989682A权利要求书2/6页8.根据权利要求7所述的方法，其中所述内容分析参数包括表示所述立体声信号的预测增益和起音强度的参数。9.一种被配置为对音频内容进行编码的系统，所述系统包括：存储器，所述存储器被配置为存储指令；处理器，所述处理器被耦接到所述存储器，并且被配置为执行存储在所述存储器中的所述指令以：从所述音频内容生成双声道立体声信号；基于所述音频内容生成方向参数，所述方向参数描述虚拟扬声器对方向，以在多个频率子带中重新创建所述音频内容的感知的主导声音地点；以及

相关资料

基于立体声的沉浸式编码（STIC）.pdf

本发明公开了一种通过双声道立体声信号和方向参数表示沉浸式信号的音频编解码器，该双声道立体声信号是沉浸式信号的立体声渲染。这些方向参数可基于描述虚拟扬声器对的方向的感知模型来重新创建所感知的主导声音的地点。可使用时频拼贴在多个声道对的频域中对立体声信号执行解码器处的音频处理。音频信号的空间定位可使用平移方法，具体通过将加权应用于针对每个输出声道对的立体声信号的时频拼贴。针对时频拼贴的加权可基于方向参数、立体声信号的分析以及输出声道布局来导出。这些加权可用于使用去相关器自适应地处理时频拼贴，以减少或最小化由于

2024-01-06

3MB

基于纹理的沉浸式视频编码.pdf

公开了用于基于纹理的渲染式视频编码的方法、装置、系统和制品。一种示例装置，包括：对应标记器，用于(i)识别第一视图的多个像素中包括的第一独特像素和第一对应像素，并且(ii)识别第二视图的多个像素中包括的第二独特像素和第二对应像素；对应斑块打包器，来(i)比较第一视图中的相邻像素，并且(ii)基于相邻像素的比较和对应关系，来识别独特像素的第一斑块和对应像素的第二斑块，对应像素的第二斑块被用识别第二视图中的对应斑块的对应列表来标记；以及图集生成器，用于生成至少一个图集来包括在编码的视频数据中，编码的视频数据不

2024-01-06

5.2MB

基于MDCT的复合预测立体声编码.pdf

本发明提供了用于在频域中使用复合预测来进行立体声编码与解码的方法及装置。在一种实施方式中，一种用于从通过复合预测编码编码的输入立体声信号来获得输出立体声信号并且包括有两个输入声道的第一频域表示的方法包括以下上混合步骤：（i）计算第一输入声道的第二频域表示；以及（ii）基于第一输入声道的第一频域表示和第二频域表示、第二输入声道的第一频域表示和复合预测系数来计算输出声道。该方法包括在上混合前后选择性地进行频域修改。

2023-06-27

2.2MB

基于MDCT的复数预测立体声编码.pdf

本发明提供了用于在频域中使用复数预测进行立体声编码和解码的方法和装置。在一个实施例中，解码方法用于从输入立体声信号获得输出立体声信号，该输入立体声信号通过复数预测编码进行编码并且包括两个输入通道的第一频域表示，该解码方法包括以下的上混步骤：（i）计算第一输入通道的第二频域表示；以及（ii）根据第一输入通道的第一频域表示和第二频域表示、第二输入通道的第一频域表示和复数预测系数来计算输出通道。可响应于控制数据将上混挂起。

2023-06-27

5.7MB

基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码.pdf

本申请涉及音频编码器和解码器系统。编码器系统的一个实施例包括缩混级，用于基于立体声信号生成缩混信号和残余信号。另外，编码器系统包括参数确定级，用于确定参数立体声参数，诸如声道间强度差和声道间交叉相关。优选地，参数立体声参数是时间和频率变化的。而且，编码器系统包括变换级。变换级通过基于缩混信号和残余信号执行变换来生成伪左/右立体声信号。该伪立体声信号由感知立体声编码器处理。对于立体声编码，能够选择左/右编码或中央/侧边编码。优选地，在左/右立体声编码和中央/侧边立体声编码之间的选择是时间和频率变化的。

2023-06-27

980KB