预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113989721A(43)申请公布日2022.01.28(21)申请号202111279535.3G06N3/08(2006.01)(22)申请日2021.10.29(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人康帅(74)专利代理机构中科专利商标代理有限责任公司11021代理人吕朝蕙(51)Int.Cl.G06V20/40(2022.01)G06V10/774(2022.01)G06V10/764(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书3页说明书11页附图6页(54)发明名称目标检测方法和目标检测模型的训练方法、装置(57)摘要本公开提供了一种目标检测方法和目标检测模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术领域。该目标检测方法可以包括:检测视频帧序列中的待处理视频帧,得到待处理视频帧包括的目标对象的预测位置信息;响应于检测到待处理视频帧包括的目标对象不完整,获取基于视频帧序列中待处理视频帧的在前视频帧确定的目标位置信息;以及响应于获取到目标位置信息,根据目标位置信息修正预测位置信息。CN113989721ACN113989721A权利要求书1/3页1.一种目标检测方法,包括:检测视频帧序列中的待处理视频帧,得到所述待处理视频帧包括的目标对象的预测位置信息;响应于检测到所述待处理视频帧包括的目标对象不完整,获取基于所述视频帧序列中所述待处理视频帧的在前视频帧确定的目标位置信息;以及响应于获取到所述目标位置信息,根据所述目标位置信息修正所述预测位置信息。2.根据权利要求1所述的方法,还包括:响应于检测到所述待处理视频帧包括的目标对象完整,基于所述预测位置信息更新所述目标位置信息。3.根据权利要求2所述的方法,其中,基于所述预测位置信息更新所述目标位置信息包括:针对所述在前视频帧中包括完整的目标对象的预定数量个目标视频帧,获取所述目标视频帧包括的目标对象的位置信息,得到预定数量个位置信息;以及基于所述预定数量个位置信息和所述预测位置信息,更新所述目标位置信息。4.根据权利要求1所述的方法,还包括:响应于未获取到所述目标位置信息,确定预定对象模板中与所述待处理视频帧包括的目标对象匹配的目标模板;以及基于所述目标模板的尺寸,修正所述预测位置信息。5.根据权利要求1所述的方法,其中,所述检测视频帧序列中的待处理视频帧,得到所述待处理视频帧包括的目标对象的预测位置信息包括:将所述待处理视频帧输入目标检测模型包括的特征提取网络,得到所述待处理视频帧的第一图像特征;以及将所述第一图像特征输入所述目标检测模型包括的位置预测网络,得到所述待处理视频帧包括的目标对象的预测位置信息;其中,所述方法还包括:将所述第一图像特征输入所述目标检测模型包括的分类网络,得到表征所述目标对象是否完整的分类信息。6.一种目标检测模型的训练方法,其中,所述目标检测模型包括特征提取网络、位置预测网络和分类网络;所述方法包括:将包括目标对象的样本图像输入特征提取网络,得到样本图像的第二图像特征,其中,所述样本图像包括目标对象的实际位置信息和表征所述目标对象是否完整的实际分类信息;将所述第二图像特征输入所述位置预测网络,得到所述目标对象的预测位置信息;将所述第二图像特征输入所述分类网络,得到表征所述目标对象是否完整的预测分类信息;以及基于所述实际位置信息、所述预测位置信息、所述实际分类信息和所述预测分类信息,对所述目标检测模型进行训练。7.一种目标检测装置,包括:第一位置预测模块,用于检测视频帧序列中的待处理视频帧,得到所述待处理视频帧包括的目标对象的预测位置信息;2CN113989721A权利要求书2/3页目标位置获取模块,用于响应于检测到所述待处理视频帧包括的目标对象不完整,获取基于所述视频帧序列中所述待处理视频帧的在前视频帧确定的目标位置信息;以及第一位置修正模块,用于响应于获取到所述目标位置信息,根据所述目标位置信息修正所述预测位置信息。8.根据权利要求7所述的装置,还包括:目标位置更新模块,用于响应于检测到所述待处理视频帧包括的目标对象完整,基于所述预测位置信息更新所述目标位置信息。9.根据权利要求8所述的装置,其中,所述目标位置更新模块包括:位置获取子模块,用于针对所述在前视频帧中包括完整的目标对象的预定数量个目标视频帧,获取所述目标视频帧包括的目标对象的位置信息,得到预定数量个位置信息;以及位置更新子模块,用于基于所述预定数量个位置信息和所述预测位置信息,更新所述目标位置信息。10.根据权利要求7所述的装置,还包括:模