预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114845077A(43)申请公布日2022.08.02(21)申请号202210344525.1(22)申请日2022.03.31(71)申请人当趣网络科技(杭州)有限公司地址310051浙江省杭州市滨江区西兴街道滨康路228号3幢C座206室(72)发明人金凌琳余锋王力(74)专利代理机构杭州创智卓英知识产权代理事务所(普通合伙)33324专利代理师刘宏全(51)Int.Cl.H04N7/14(2006.01)H04N21/44(2011.01)H04N21/4402(2011.01)权利要求书2页说明书7页附图6页(54)发明名称视频通话的处理方法和系统(57)摘要本申请涉及一种视频通话的处理方法和系统,通过获取视频帧以及视频帧的人脸检测结果,根据人脸检测结果,获取视频帧的人脸区域位置,根据人脸区域位置确定视频帧的裁剪区域位置,根据裁剪区域位置对视频帧进行裁剪,获得裁剪后的视频帧,其中,裁剪区域大于人脸区域,将裁剪后的视频帧渲染到本地显示界面进行显示,用户在摄像头拍摄到的区域内走动时,根据人脸区域的位置移动裁剪区域的位置,使人脸区域一直居中显示在裁剪区域内,因此可使人脸居中显示在显示界面上,解决了相关技术中摄像头无法转动,当用户走动时,人脸在显示界面上无法保持居中的位置,导致用户视频通话的质量低,用户体验感不好的问题,提升了视频通话过程的用户体验。CN114845077ACN114845077A权利要求书1/2页1.一种视频通话的处理方法,其特征在于,所述方法包括:获取视频帧以及所述视频帧的人脸检测结果;根据所述人脸检测结果,获取所述视频帧的人脸区域位置;根据所述人脸区域位置确定所述视频帧的裁剪区域位置,根据所述裁剪区域位置对所述视频帧进行裁剪,获得裁剪后的视频帧,其中,所述裁剪区域大于所述人脸区域;将所述裁剪后的视频帧渲染到本地显示界面进行显示。2.根据权利要求1所述的方法,其特征在于,根据所述人脸检测结果,获取所述视频帧的人脸区域位置包括:根据所述人脸检测结果判断所述视频帧为单人还是多人,在所述视频帧为单人的情况下,获取单人人脸所在的位置,根据所述单人人脸所在的位置确定所述人脸区域位置。3.根据权利要求2所述的方法,其特征在于,在所述视频帧为多人的情况下,所述方法包括:获取距离视频帧左边距最小值和最大值对应的目标人脸,以及距离视频帧上边距最小值和最大值对应的目标人脸,或,获取距离视频帧右边距最小值和最大值对应的目标人脸,以及距离视频帧下边距最小值和最大值对应的目标人脸,包含所有所述目标人脸的最小矩形为所述人脸区域位置。4.根据权利要求1所述的方法,其特征在于,根据所述人脸区域位置确定所述视频帧的裁剪区域位置包括:获取人脸区域中心,若所述人脸区域中心在预设范围内,则以所述人脸区域中心作为所述裁剪区域中心,根据所述裁剪区域中心确定所述视频帧的裁剪区域位置。5.根据权利要求4所述的方法,其特征在于,若所述人脸区域中心在预设范围外,则所述方法包括:假设将人脸区域中心平移至相应的预设范围边界上,以假设的人脸区域中心作为所述裁剪区域中心,根据所述裁剪区域中心确定所述视频帧的裁剪区域位置。6.根据权利要求4所述的方法,其特征在于,若所述人脸区域中心在预设范围外,则所述方法还包括:缩小所述裁剪区域,使所述裁剪区域中心在所述人脸区域中心上且裁剪区域不超出视频帧范围。7.根据权利要求1至6任一项所述的方法,其特征在于,在当前视频帧相对于上一视频帧的人脸区域位置移动的情况下,所述方法还包括:若所述人脸区域位置在x轴方向上的移动距离和y轴方向上的移动距离小于预设值,则当前视频帧的裁剪区域位置相对于上一视频帧的裁剪区域位置不变。8.根据权利要求1所述的方法,其特征在于,所述获得裁剪后的视频帧之后,所述方法还包括:将所述裁剪后的视频帧进行放大或缩小,获得放大或缩小后的视频帧,将所述放大或缩小后的视频帧渲染到本地显示界面进行显示。9.根据权利要求1所述的方法,其特征在于,所述获得裁剪后的视频帧之后,所述方法还包括:将所述裁剪后的视频帧渲染到编码器,并输出到对端显示界面进行显示。2CN114845077A权利要求书2/2页10.一种视频通话的处理系统,其特征在于,所述系统包括检测模块、获取模块、裁剪模块和显示模块,所述检测模块,用于获取视频帧以及所述视频帧的人脸检测结果;所述获取模块,用于根据所述人脸检测结果,获取所述视频帧的人脸区域位置;所述裁剪模块,用于根据所述人脸区域位置确定所述视频帧的裁剪区域位置,根据所述裁剪区域位置对所述视频帧进行裁剪,获得裁剪后的视频帧,其中,所述裁剪区域大于所述人脸区域;所述显示模块,用于将所述裁剪后的视频帧渲染到本地显示界面进行显示。3CN11484