预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113628250A(43)申请公布日2021.11.09(21)申请号202110996464.2(22)申请日2021.08.27(71)申请人北京澎思科技有限公司地址100020北京市朝阳区将台路5号30号楼一层108室(72)发明人罗伯特·罗恩思赵磊马原(74)专利代理机构北京智信四方知识产权代理有限公司11519代理人钟文芳(51)Int.Cl.G06T7/246(2017.01)G06T7/73(2017.01)权利要求书2页说明书10页附图4页(54)发明名称目标跟踪方法、装置、电子设备以及可读存储介质(57)摘要本公开实施例公开了一种目标跟踪方法、装置、电子设备以及可读存储介质。该目标跟踪方法包括:获取上一帧的目标边界框;将上一帧的目标边界框的尺寸放大以生成搜索区域;将当前帧在搜索区域内的图像数据缩放到预定尺寸;将缩放后的图像数据输入目标跟踪网络,以便从多个候选锚点框中确定目标锚点框,并获取目标锚点框的位置偏移量和尺寸调整信息;基于位置偏移量和尺寸调整信息调整目标锚点框,以便从搜索区域中确定目标区域;基于搜索区域以及目标区域在搜索区域中的位置,确定目标在当前帧中的位置,表示为当前帧的目标边界框,从而减小了跳帧处理下目标在图像上的变化对目标跟踪效果的影响,提高了目标跟踪的正确性。CN113628250ACN113628250A权利要求书1/2页1.一种目标跟踪方法,包括:获取上一帧的目标边界框;将所述上一帧的目标边界框的尺寸放大以生成搜索区域;将当前帧在所述搜索区域内的图像数据缩放到预定尺寸;将缩放后的图像数据输入目标跟踪网络,以便从多个候选锚点框中确定目标锚点框,并获取所述目标锚点框的位置偏移量和尺寸调整信息;基于所述位置偏移量和尺寸调整信息调整所述目标锚点框,以便从所述搜索区域中确定目标区域;基于所述搜索区域以及所述目标区域在搜索区域中的位置,确定目标在所述当前帧中的位置,表示为所述当前帧的目标边界框。2.根据权利要求1所述的方法,其中,所述将缩放后的图像数据输入目标跟踪网络,以便从多个候选锚点框中确定目标锚点框,并获取所述目标锚点框的位置偏移量和尺寸调整信息包括:将缩放后的图像数据输入目标跟踪网络,以获取目标置信度、位置偏移量和尺寸调整信息;基于所述目标置信度,从多个候选锚点框中确定目标锚点框。3.根据权利要求2所述的方法,其中,所述目标跟踪网络包括五个串联的卷积层,在第一个卷积层和第二个卷积层后分别设置有池化层,最后一个卷积层包括六个通道,其中,所述六个通道中的两个通道用于输出所述目标置信度,所述六个通道中的另外四个通道用于输出所述位置偏移量和尺寸调整信息,其中,所述第一个卷积层的输入尺寸与所述预定尺寸一致,所述最后一个卷积的输出尺寸与所述候选锚点框的数量相匹配。4.根据权利要求2所述的方法,其中,所述目标置信度包括每个候选锚点框为目标锚点框的第一概率和非目标锚点框的第二概率,所述基于所述目标置信度,从多个候选锚点框中确定目标锚点框包括:确定每个所述候选锚点框的所述第一概率和第二概率的差值;基于所述差值,从所述多个候选锚点框中确定目标锚点框。5.根据权利要求1~4任一项所述的方法,其中,所述缩放后的图像数据的大小为k×k,所述候选锚点框的数量为n×n,大小为m×m,步长为s,满足k=m+(n‑1)×s,其中,k、m、n、s为整数,且k∈[48,96],n∈[7,19],m∈[12,48],s∈[4,12]。6.根据权利要求1~4任一项所述的方法,其中,所述搜索区域的尺寸为所述上一帧的目标边界框的尺寸的1‑10倍,所述目标跟踪方法用于通过头部区域跟踪人体。7.根据权利要求1~4任一项所述的方法,其中,所述基于所述位置偏移量和尺寸调整信息调整所述目标锚点框,以便从所述搜索区域中确定目标区域包括:确定位置偏移量(xp,yp)和尺寸调整信息(wp,hp),其中,xp为水平偏移量,yp为竖直偏移量,wp为宽度调整信息,hp为高度调整信息;确定目标锚点框的位置(cx,cy,wa,ha),其中,cx、cy、wa、ha分别为目标锚点框在搜索区域中的水平位置坐标、竖直位置坐标、宽度和高度;确定目标区域在搜索区域中的位置(x,y,w,h),x、y、w、h分别为目标区域在搜索区域中2CN113628250A权利要求书2/2页的水平位置坐标、竖直位置坐标、宽度和高度,其中:x=xp+cx;y=yp+cy;w=wa×ewp;h=ha×ehp,e为自然常数。8.一种目标跟踪装置,包括:获取模块,被配置为获取上一帧的目标边界框;放大模块,被配置为将所述上一帧的目标边界框的尺寸放大以生成搜索区域;缩放模块,被配置为将当前帧在所述搜索区域内的图像数据缩放到预定尺