预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共48页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107004419A(43)申请公布日2017.08.01(21)申请号201580063452.7(74)专利代理机构北京康信知识产权代理有限责任公司1(22)申请日2015.11.091240代理人余刚吴孟秋(30)优先权数据2014-2419532014.11.28JP(51)Int.Cl.G10L19/008(2006.01)(85)PCT国际申请进入国家阶段日H04N21/236(2006.01)2017.05.22H04N21/439(2006.01)(86)PCT国际申请的申请数据H04S5/02(2006.01)PCT/JP2015/0815242015.11.09(87)PCT国际申请的公布数据WO2016/084592JA2016.06.02(71)申请人索尼公司地址日本东京(72)发明人高桥和幸北里直久权利要求书3页说明书18页附图26页(54)发明名称发送装置、发送方法、接收装置和接收方法(57)摘要本发明的目的是即使在接收侧执行视图切换的情况下也能准确地执行3D音频渲染。发送装置生成具有第一视图的视频数据的第一视频流、具有第二视图的视频数据的第二视频流,以及具有对象声源的音频数据和对象声源的基于第一视图的位置信息的音频流。发送装置发送预定格式的容器,容器包括第一视频流、第二视频流、音频流和位置校正信息,该位置校正信息用于将对象声源的位置信息校正为基于第二视图的位置信息。CN107004419ACN107004419A权利要求书1/3页1.一种发送装置,包括:编码单元,被配置为生成具有第一视图的视频数据的第一视频流、具有第二视图的视频数据的第二视频流,以及具有对象声源的音频数据和所述对象声源的基于所述第一视图的位置信息的音频流;以及发送单元,被配置为发送预定格式的容器,所述容器包括所述第一视频流、所述第二视频流、所述音频流以及位置校正信息,所述位置校正信息用于将所述对象声源的所述位置信息校正为基于所述第二视图的位置信息。2.根据权利要求1所述的发送装置,其中,所述位置校正信息指示所述第一视图和所述第二视图的位置和方向的差值分量。3.根据权利要求1所述的发送装置,其中,将所述位置校正信息插入至所述音频流的层中。4.根据权利要求3所述的发送装置,其中,将所述位置校正信息插入至包括位置信息的元数据区域中。5.根据权利要求3所述的发送装置,其中,将所述位置校正信息插入至用户数据区域中。6.根据权利要求3所述的发送装置,其中,当存在多个所述第二视图时,将对应于多个所述第二视图的多条位置校正信息插入至所述音频流的层中,并且将指示所述多条所述位置校正信息分别对应的所述第二视频流的信息插入至所述容器的层中。7.根据权利要求1所述的发送装置,其中,将所述位置校正信息插入至所述第二视频流的层中。8.根据权利要求1所述的发送装置,其中,将所述位置校正信息插入至所述容器的层中。9.根据权利要求8所述的发送装置,其中,将所述位置校正信息作为信令信息插入。10.根据权利要求9所述的发送装置,其中,所述容器为MPEG2-TS,并且将所述位置校正信息插入至视频基本流环中,所述视频基本流环对应于节目映射表的所述第二视频流。11.根据权利要求8所述的发送装置,其中,插入包括所述位置校正信息的信息流。12.一种发送方法,包括:编码步骤,生成具有第一视图的视频数据的第一视频流、具有第二视图的视频数据的第二视频流,以及具有对象声源的音频数据和所述对象声源的基于所述第一视图的位置信息的音频流;以及发送步骤,通过发送单元发送预定格式的容器,所述容器包括所述第一视频流、所述第二视频流、所述音频流以及位置校正信息,所述位置校正信息用于将所述对象声源的位置信息校正为基于所述第二视图的位置信息。13.一种接收装置,包括:接收单元,被配置为接收预定格式的容器,所述容器包括具有第一视图的视频数据的2CN107004419A权利要求书2/3页第一视频流、具有第二视图的视频数据的第二视频流、具有对象声源的音频数据和所述对象声源的基于所述第一视图的位置信息的音频流,以及用于将所述对象声源的位置信息校正为基于所述第二视图的位置信息的位置校正信息;以及处理单元,被配置为处理包括在所述容器中的信息。14.根据权利要求13所述的接收装置,其中,所述处理单元包括:解码单元,被配置为从所述第一视频流、所述第二视频流和所述音频流获得所述第一视图的视频数据、所述第二视图的视频数据以及所述对象声源的音频数据和位置信息,选择器,被配置为选择性地输出所述第一视图的视频数据或者所述第二视图的视频数据,渲染单元,被配置为基于所述对象声源的所述位置信息将所述对象声源的音频数据映射到任何扬声器位置,并且当通过所述选择器