预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113676622A(43)申请公布日2021.11.19(21)申请号202010413702.8(22)申请日2020.05.15(71)申请人杭州海康威视数字技术股份有限公司地址310051浙江省杭州市滨江区阡陌路555号(72)发明人徐新刚(74)专利代理机构北京德琦知识产权代理有限公司11018代理人程杰王琦(51)Int.Cl.H04N5/225(2006.01)H04N5/232(2006.01)H04N7/15(2006.01)G10L25/51(2013.01)权利要求书2页说明书9页附图9页(54)发明名称视频处理方法、摄像装置、视频会议系统及存储介质(57)摘要本申请提出了视频处理方法、摄像装置、视频会议系统及存储介质。其中,一种视频处理方法,包括:在视频会议场景中由摄像装置采集第一图像帧,并生成对应的第一全景图;基于声源定位方式,确定声源位置,所述声源位置为:声源相对于所述摄像装置的空间角度;确定第一全景图中的目标对象;在所述第一全景图的目标对象中,确定与声源位置对应的发声对象;判断第一发声对象的持续发声时长是否达到第一时长阈值,所述第一发声对象表示所述第一全景图中的任一个发声对象;在确定所述持续发声时长达到第一时长阈值时,生成所述第一发声对象的特写图像。CN113676622ACN113676622A权利要求书1/2页1.一种视频处理方法,其特征在于,包括:在视频会议场景中由摄像装置采集第一图像帧,并生成对应的第一全景图;基于声源定位方式,确定声源位置,所述声源位置为:声源相对于所述摄像装置的空间角度;确定第一全景图中的目标对象;在所述第一全景图的目标对象中,确定与声源位置对应的发声对象;判断第一发声对象的持续发声时长是否达到第一时长阈值,所述第一发声对象表示所述第一全景图中的任一个发声对象;在确定所述持续发声时长达到第一时长阈值时,生成所述第一发声对象的特写图像。2.如权利要求1所述的视频处理方法,其特征在于,进一步包括:采集第二图像帧,并生成对应的第二全景图,所述第二图像帧的采集时间晚于所述第一图像帧;在确定第二全景图的目标对象中的发声对象不包括所述第一发声对象时,判断所述第一发声对象的持续未发声时长是否达到第二时长阈值;在所述第一发声对象的持续未发声时间未达到第二时长阈值时,生成所述第二全景图中第一发声对象的特写图像。3.如权利要求1所述的视频处理方法,其特征在于,进一步包括:将第一全景图和第一全景图对应的特写图像拼接为一个第一输出图像帧,并向显示设备传输该第一输出图像帧;或者将第一全景图对应的各特写图像拼接为一个第二输出图像帧,并向显示设备传输所述第一全景图和所述第二输出图像帧;或者向显示设备传输所述第一全景图和第一全景图对应的各特写图像。4.如权利要求1所述的视频处理方法,其特征在于,所述基于声源定位方式,确定声源位置,包括:基于声源定位方式,确定声源相对于摄像装置的水平角度,声源位置包括声源相对于摄像装置的水平角度;或者基于声源定位方式,确定声源相对于摄像装置的水平角度和相对于摄像装置的垂直角度,声源位置包括声源的水平角度和垂直角度。5.如权利要求4所述的视频处理方法,其特征在于,所述在所述第一全景图的目标对象中,确定与声源位置对应的发声对象,包括:确定所述声源位置是否处于所述第一全景图的目标对象的角度范围;在确定一个所述声源位置处于一个目标对象的角度范围时,将该目标对象确定为与该声源位置对应的发声对象;在确定一个所述声源位置未处于任一个目标对象的角度范围时,确定以所述声源位置为中心的一个预定角度区间是否与所述第一全景图的目标对象的角度范围存在重叠;在确定预定角度区间与一个目标对象的角度范围存在重叠时,将该目标对象确定为相应声源位置对应的发声对象。6.一种摄像装置,其特征在于,包括:全景图获取单元,在视频会议场景中采集第一图像帧,并生成对应的第一全景图;2CN113676622A权利要求书2/2页定位单元,基于声源定位方式,确定声源位置,所述声源位置为:声源相对于所述摄像装置的空间角度;识别单元,确定第一全景图中的目标对象;确定单元,在所述第一全景图的目标对象中,确定与声源位置对应的发声对象;判断单元,判断第一发声对象的持续发声时长是否达到第一时长阈值,所述第一发声对象表示所述第一全景图中的任一个发声对象;生成单元,在所述判断单元确定所述持续发声时长达到第一时长阈值时,生成所述第一发声对象的特写图像。7.如权利要求1所述的摄像装置,其特征在于,全景图获取单元还用于,采集第二图像帧,并生成对应的第二全景图,所述第二图像帧的采集时间晚于所述第一图像帧;判断单元还用于,在确定第二全景图的目标对象中的发声对象不包括所述第