预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110505399A(43)申请公布日2019.11.26(21)申请号201910746092.0(22)申请日2019.08.13(71)申请人聚好看科技股份有限公司地址266100山东省青岛市崂山区松岭路399号(72)发明人王光强林宏伟薛新丽王之奎贾其燕(74)专利代理机构深圳市隆天联鼎知识产权代理有限公司44232代理人朱黎(51)Int.Cl.H04N5/232(2006.01)G10L17/06(2013.01)G01S5/18(2006.01)H04N7/15(2006.01)权利要求书2页说明书11页附图5页(54)发明名称图像采集的控制方法、装置及采集终端(57)摘要本公开揭示了一种图像采集的控制方法,应用于采集终端,包括:对采集的音频进行声纹识别,通过所述声纹识别确定发言人是否变化;若发言人变化,则根据所采集的音频定位所述音频所对应发言人在空间中的位置;根据所定位到的位置,对所述采集终端中的摄像头进行调整,调整后,所述音频所对应发言人位于所述摄像头的拍摄画面中央,所述调整包括调整所述摄像头的拍摄角度和/或调整所述摄像头的焦距;通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像。实现了根据音频进行发言人跟踪定位,并调节摄像头以采集发言人的图像,有效解决了现有技术中因发言人位于拍摄盲区所导致不能采集到发言人的图像的问题。CN110505399ACN110505399A权利要求书1/2页1.一种图像采集的控制方法,应用于采集终端,其特征在于,所述方法包括:对采集的音频进行声纹识别,通过所述声纹识别确定发言人是否变化;若发言人变化,则根据所采集的音频定位所述音频所对应发言人在空间中的位置;根据所定位到的位置,对所述采集终端中的摄像头进行调整,调整后,所述音频所对应发言人位于所述摄像头的拍摄画面中央,所述调整包括调整所述摄像头的拍摄角度和/或调整所述摄像头的焦距;通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像。2.根据权利要求1所述的方法,其特征在于,所述对所述音频进行声纹识别,通过所述声纹识别判断发言人是否变化,包括:从所述音频中提取声纹特征;计算所提取声纹特征相对于上一所采集音频所对应声纹特征的声纹相似度;根据所述声纹相似度确定发言人是否变化。3.根据权利要求1所述的方法,其特征在于,所述采集终端包括一个参考声音采集模块和至少三个非参考声音采集模块,所述根据所采集的音频定位所述音频所对应发言人在空间中的位置,包括:根据所述参考声音采集模块和所述非参考声音采集模块所分别采集到所述音频的时间,计算得到每一所述非参考声音采集模块相对于所述参考声音采集模块采集到所述音频的时延;根据所述参考声音采集模块、所述非参考声音采集模块的布置位置和所述时延进行计算,获得所述音频所对应发言人的位置坐标。4.根据权利要求1所述的方法,其特征在于,所述根据所定位到的位置,对所述采集终端中的摄像头进行调整,包括:根据所定位到的位置,确定所述音频所对应发言人相对于所述摄像头的距离和方位;根据所确定的距离调整所述摄像头的焦距,以及根据所确定的方位调整所述摄像头的拍摄角度。5.根据权利要求1所述的方法,其特征在于,所述通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像,包括:根据调整后的摄像头所采集的图像,进行发言人识别,在所述图像中定位所述发言人的人像;根据所定位到的人像对所述图像进行剪裁,获得所述发言人的图像。6.根据权利要求5所述的方法,其特征在于,所述根据调整后的摄像头所采集的图像,进行发言人识别,在所述图像中定位所述发言人的人像,包括:根据调整后的摄像头所采集的图像,为所采集图像中的每一人像对指定器官进行像素点提取;根据所提取的像素点进行动作识别,确定所提取像素点所表征的动作;将所表征动作与预定动作相符的像素点所在人像确定为发言人的人像。7.根据权利要求1所述的方法,其特征在于,所述通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像之后,所述方法还包括:将所述采集终端所显示的图像替换为所述发言人的图像。2CN110505399A权利要求书2/2页8.根据权利要求1所述的方法,其特征在于,所述方法还包括:检测在间隔设定时间段后是否仍未采集到音频;若为是,则控制所述摄像头旋转至预设拍摄角度;若为否,则执行所述对采集的音频进行声纹识别的步骤。9.一种图像采集的控制装置,应用于采集终端,其特征在于,所述装置包括:声纹识别模块,用于对采集的音频进行声纹识别,通过所述声纹识别确定发言人是否变化;定位模块,用于若声纹识别模块判断发言人变化,则根据所采集的音频定位所述音频所对应发言人在空间中的位置;控制模块,用于根据所定位到的位置