视频处理方法、摄像装置、视频会议系统及存储介质-豆柴文库

视频处理方法、摄像装置、视频会议系统及存储介质.pdf

2023-07-25

10金币

889KB

21页

冷霜****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共21页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113676622A(43)申请公布日2021.11.19(21)申请号202010413702.8(22)申请日2020.05.15(71)申请人杭州海康威视数字技术股份有限公司地址310051浙江省杭州市滨江区阡陌路555号(72)发明人徐新刚(74)专利代理机构北京德琦知识产权代理有限公司11018代理人程杰王琦(51)Int.Cl.H04N5/225(2006.01)H04N5/232(2006.01)H04N7/15(2006.01)G10L25/51(2013.01)权利要求书2页说明书9页附图9页(54)发明名称视频处理方法、摄像装置、视频会议系统及存储介质(57)摘要本申请提出了视频处理方法、摄像装置、视频会议系统及存储介质。其中，一种视频处理方法，包括：在视频会议场景中由摄像装置采集第一图像帧，并生成对应的第一全景图；基于声源定位方式，确定声源位置，所述声源位置为：声源相对于所述摄像装置的空间角度；确定第一全景图中的目标对象；在所述第一全景图的目标对象中，确定与声源位置对应的发声对象；判断第一发声对象的持续发声时长是否达到第一时长阈值，所述第一发声对象表示所述第一全景图中的任一个发声对象；在确定所述持续发声时长达到第一时长阈值时，生成所述第一发声对象的特写图像。CN113676622ACN113676622A权利要求书1/2页1.一种视频处理方法，其特征在于，包括：在视频会议场景中由摄像装置采集第一图像帧，并生成对应的第一全景图；基于声源定位方式，确定声源位置，所述声源位置为：声源相对于所述摄像装置的空间角度；确定第一全景图中的目标对象；在所述第一全景图的目标对象中，确定与声源位置对应的发声对象；判断第一发声对象的持续发声时长是否达到第一时长阈值，所述第一发声对象表示所述第一全景图中的任一个发声对象；在确定所述持续发声时长达到第一时长阈值时，生成所述第一发声对象的特写图像。2.如权利要求1所述的视频处理方法，其特征在于，进一步包括：采集第二图像帧，并生成对应的第二全景图，所述第二图像帧的采集时间晚于所述第一图像帧；在确定第二全景图的目标对象中的发声对象不包括所述第一发声对象时，判断所述第一发声对象的持续未发声时长是否达到第二时长阈值；在所述第一发声对象的持续未发声时间未达到第二时长阈值时，生成所述第二全景图中第一发声对象的特写图像。3.如权利要求1所述的视频处理方法，其特征在于，进一步包括：将第一全景图和第一全景图对应的特写图像拼接为一个第一输出图像帧，并向显示设备传输该第一输出图像帧；或者将第一全景图对应的各特写图像拼接为一个第二输出图像帧，并向显示设备传输所述第一全景图和所述第二输出图像帧；或者向显示设备传输所述第一全景图和第一全景图对应的各特写图像。4.如权利要求1所述的视频处理方法，其特征在于，所述基于声源定位方式，确定声源位置，包括：基于声源定位方式，确定声源相对于摄像装置的水平角度，声源位置包括声源相对于摄像装置的水平角度；或者基于声源定位方式，确定声源相对于摄像装置的水平角度和相对于摄像装置的垂直角度，声源位置包括声源的水平角度和垂直角度。5.如权利要求4所述的视频处理方法，其特征在于，所述在所述第一全景图的目标对象中，确定与声源位置对应的发声对象，包括：确定所述声源位置是否处于所述第一全景图的目标对象的角度范围；在确定一个所述声源位置处于一个目标对象的角度范围时，将该目标对象确定为与该声源位置对应的发声对象；在确定一个所述声源位置未处于任一个目标对象的角度范围时，确定以所述声源位置为中心的一个预定角度区间是否与所述第一全景图的目标对象的角度范围存在重叠；在确定预定角度区间与一个目标对象的角度范围存在重叠时，将该目标对象确定为相应声源位置对应的发声对象。6.一种摄像装置，其特征在于，包括：全景图获取单元，在视频会议场景中采集第一图像帧，并生成对应的第一全景图；2CN113676622A权利要求书2/2页定位单元，基于声源定位方式，确定声源位置，所述声源位置为：声源相对于所述摄像装置的空间角度；识别单元，确定第一全景图中的目标对象；确定单元，在所述第一全景图的目标对象中，确定与声源位置对应的发声对象；判断单元，判断第一发声对象的持续发声时长是否达到第一时长阈值，所述第一发声对象表示所述第一全景图中的任一个发声对象；生成单元，在所述判断单元确定所述持续发声时长达到第一时长阈值时，生成所述第一发声对象的特写图像。7.如权利要求1所述的摄像装置，其特征在于，全景图获取单元还用于，采集第二图像帧，并生成对应的第二全景图，所述第二图像帧的采集时间晚于所述第一图像帧；判断单元还用于，在确定第二全景图的目标对象中的发声对象不包括所述第

相关资料

视频处理方法、摄像装置、视频会议系统及存储介质.pdf

本申请提出了视频处理方法、摄像装置、视频会议系统及存储介质。其中，一种视频处理方法，包括：在视频会议场景中由摄像装置采集第一图像帧，并生成对应的第一全景图；基于声源定位方式，确定声源位置，所述声源位置为：声源相对于所述摄像装置的空间角度；确定第一全景图中的目标对象；在所述第一全景图的目标对象中，确定与声源位置对应的发声对象；判断第一发声对象的持续发声时长是否达到第一时长阈值，所述第一发声对象表示所述第一全景图中的任一个发声对象；在确定所述持续发声时长达到第一时长阈值时，生成所述第一发声对象的特写图像。

2023-07-25

889KB

视频处理方法、装置、视频处理设备及存储介质.pdf

本申请涉及视频处理技术领域，尤其涉及一种视频处理方法、装置、视频处理设备及存储介质，其中，该视频处理方法包括：调用目标视频处理模型对目标视频数据进行特征提取，得到目标视频数据的视频特征；基于视频特征对目标视频数据进行分类处理，得到目标视频数据的分类信息；基于视频特征对目标视频数据进行标签识别处理，得到目标视频数据的标签信息；根据分类信息和标签信息确定目标视频数据的标识信息。该标识信息兼具鲁棒性和可分性。

2023-07-25

1.2MB

视频处理方法、装置、视频追踪方法、装置及存储介质.pdf

本申请公开了一种视频处理方法、装置、视频追踪方法、装置及存储介质。其中，响应于请求端对目标视频数据的获取请求，获取请求端的用户标识；生成目标视频数据对应的N份切片序列；N份切片序列中M份切片序列的单帧图像中均携带有编码标识；不同份的切片序列中编码标识的图像位置不同；基于用户标识，从N份切片序列中分别提取至少一组切片数据，得到重组后的切片序列；重组后的切片序列的m组切片数据中，编码标识的图像位置用于唯一地指示用户标识；以及将重组后的切片序列发送至请求端，以供请求端播放重组后的切片序列。可以解决现有技术中存在

2023-07-25

873KB

视频处理方法、装置及存储介质.pdf

本申请涉及视频处理方法、装置及存储介质。所述方法包括：第一设备在监测到对多个相机的预览请求时，在相机Android应用程序包APK创建多个相机对应的视图以及缓存、并将视图对应的缓存下发到框架FWK层，通过FWK层从硬件抽象层HAL获取多个相机对应的相机数据流；第一设备通过FWK层的图层传递模块，将多个相机数据流分别渲染到对应的缓存上。通过多个视图承接并显示多个相机的相机数据流，采用图层传递模块将多个相机数据流渲染到对应的视图的缓存上，实现快速预览。

2024-01-06

1.3MB

视频处理方法、装置及存储介质.pdf

本发明提供了一种视频处理方法、装置及存储介质，在当前界面上，通过触控操作跳转到视频播放界面，并向服务器发送视频请求指令；在视频无障碍模式下，响应于播放指令，基于视频综合数据播放目标视频，且在目标视频上叠加显示出透明控件层和控制控件层；响应于针对透明控件层和/或控制控件层的触发操作，根据视频综合数据，对目标视频进行内容提示和/或播放情况提示；当目标对象需要视频提示时，可以针对透明控件层或者控制控件层进行触发操作，进而可以分别得到简短的内容提示或者播放情况提示，由于将内容提示和播放情况提示分开进行提示，所以本

2023-06-14

1.9MB