预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共38页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114631141A(43)申请公布日2022.06.14(21)申请号202080076679.6(74)专利代理机构北京市汉坤律师事务所(22)申请日2020.10.2911602专利代理师魏小薇吴丽丽(30)优先权数据62/927,7902019.10.30US(51)Int.Cl.63/086,4652020.10.01USG10L19/008(2013.01)(85)PCT国际申请进入国家阶段日2022.04.29(86)PCT国际申请的申请数据PCT/US2020/0578852020.10.29(87)PCT国际申请的公布数据WO2021/087063EN2021.05.06(71)申请人杜比实验室特许公司地址美国加利福尼亚州(72)发明人D·S·麦格拉思权利要求书3页说明书22页附图12页(54)发明名称使用方向性元数据的多通道音频编码和解码(57)摘要本公开涉及处理空间音频信号以生成该空间音频信号的压缩表示的方法。该方法包括:分析该空间音频信号以确定一或多个音频元素的到达方向;针对至少一个频率子带,确定与该到达方向相关联的信号功率的相应指示;生成包括方向信息和能量信息的元数据,该方向信息包括该音频元素的到达方向的指示,该能量信息包括信号功率的相应指示;基于该空间音频信号来生成具有预定义数量的通道的基于通道的音频信号;及输出该基于通道的音频信号及该元数据作为该压缩表示。本公开进一步涉及处理空间音频信号的压缩表示以生成该空间音频信号的重构表示的方法和对应的设备、程序以及储存媒体。CN114631141ACN114631141A权利要求书1/3页1.一种处理空间音频信号以生成所述空间音频信号的压缩表示的方法,所述方法包括:分析所述空间音频信号,以确定在由所述空间音频信号表示的音频场景中的一个或多个音频元素的到达方向;针对所述空间音频信号的至少一个频率子带,确定与所确定的到达方向相关联的信号功率的相应指示;生成包括方向信息和能量信息的元数据,其中所述方向信息包括所述一个或多个音频元素的所确定的到达方向的指示,所述能量信息包括与所确定的到达方向相关联的信号功率的相应指示;基于所述空间音频信号来生成具有预定义数量的通道的基于通道的音频信号;以及输出所述基于通道的音频信号和所述元数据作为所述空间音频信号的所述压缩表示。2.根据权利要求1所述的方法,其中分析所述空间音频信号是基于所述空间音频信号的多个频率子带的。3.根据权利要求1或2所述的方法,其中分析所述空间音频信号涉及将场景分析应用于所述空间音频信号。4.根据权利要求3所述的方法,其中所述空间音频信号是多通道音频信号;或其中所述空间音频信号是基于对象的音频信号,并且所述方法进一步包括在应用所述场景分析之前,将所述基于对象的音频信号转换成多通道音频信号。5.根据前述权利要求中任一项所述的方法,其中与给定到达方向相关联的信号功率的指示与所述给定到达方向的所述频率子带中的信号功率相对于所述频率子带中的总信号功率的分数有关。6.根据前述权利要求中任一项所述的方法,其中信号功率的所述指示是针对多个频率子带中的每一个频率子带来确定的,并且针对给定到达方向和给定频率子带,信号功率的所述指示与所述给定到达方向的所述给定频率子带中的信号功率相对于所述给定频率子带中的总信号功率的分数有关。7.根据前述权利要求中任一项所述的方法,其中,分析所述空间音频信号、确定信号功率的相应指示、以及生成所述基于通道的音频信号是在逐时段的基础上执行的。8.根据前述权利要求中任一项所述的方法,其中,分析所述空间音频信号、确定信号功率的相应指示、以及生成所述基于通道的音频信号是基于空间音频信号的时频表示来执行的。9.根据权利要求1至3或5至8中任一项所述的方法,其中所述空间音频信号是包括多个音频对象和相关联的方向向量的基于对象的音频信号;其中所述方法进一步包括通过将所述音频对象移动至预定义组的音频通道来生成所述多通道音频信号,其中每个音频对象根据其方向向量被移动至所述预定义组的音频通道;并且其中所述基于通道的音频信号是通过将降混操作应用于所述多通道音频信号而生成的降混信号。10.根据权利要求1至3或5至8中任一项所述的方法,其中所述空间音频信号是多通道音频信号;并且2CN114631141A权利要求书2/3页其中所述基于通道的音频信号是通过将降混操作应用于所述多通道音频信号而生成的降混信号。11.一种处理空间音频信号的压缩表示以生成所述空间音频信号的重构表示的方法,其中所述压缩表示包括具有预定义数量的通道的基于通道的音频信号和元数据,所述元数据包括方向信息和能量信息,其中所述方向信息包括音频场景中的一个或多个音频元素的到达方向的指示,所述能量信息包