预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115984651A(43)申请公布日2023.04.18(21)申请号202310080700.5(22)申请日2023.02.08(71)申请人重庆特斯联启智科技有限公司地址401329重庆市九龙坡区高新区金凤镇凤笙路21号1幢(72)发明人徐博诚冯琰一何英杰聂虎(74)专利代理机构北京中知法苑知识产权代理有限公司11226专利代理师李明赵吉阳(51)Int.Cl.G06V10/774(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)G06N3/08(2023.01)G06N3/0464(2023.01)权利要求书2页说明书8页附图1页(54)发明名称目标检测模型的训练方法及装置、电子设备、存储介质(57)摘要本公开实施例涉及目标识别技术领域,提供了一种目标检测模型的训练方法及装置、电子设备、存储介质,训练方法包括:确定原始行为识别数据集;对原始行为识别数据集进行数据增强处理;对数据增强后的原始行为识别数据集进行裁剪处理,得到目标数据集;构建基于自监督学习的目标检测模型;利用目标数据集对目标检测模型进行训练,得到训练好的目标检测模型。本公开实施例的基于自监督学习的目标检测模型,能够从大规模未标记数据中学习图像特征,而无需使用任何人工标注数据,并能达到甚至超越监督学习方法达到的精度,有效解决现有的目标检测算法对小目标物体检测不准确且分类错误的问题。CN115984651ACN115984651A权利要求书1/2页1.一种目标检测模型的训练方法,其特征在于,所述训练方法包括:确定原始行为识别数据集;对所述原始行为识别数据集进行数据增强处理;对数据增强后的所述原始行为识别数据集进行裁剪处理,得到目标数据集;构建基于自监督学习的目标检测模型;利用所述目标数据集对所述目标检测模型进行训练,得到训练好的所述目标检测模型。2.根据权利要求1所述的训练方法,其特征在于,所述对所述原始行为识别数据集进行数据增强处理,包括:对所述原始行为识别数据集分别进行归一化处理、多尺度缩放处理、旋转增强处理。3.根据权利要求2所述的训练方法,其特征在于,所述对所述原始行为识别数据集分别进行归一化处理、多尺度缩放处理、旋转增强处理,包括:根据下式(1)对所述原始行为识别数据集进行归一化处理:其中,i表示所述原始行为识别数据集中的图像数据,i*表示i对应的归一化后的图像数据,max(i)表示i中的最大值,min(i)表示i中的最小值。4.根据权利要求3所述的训练方法,其特征在于,所述对所述原始行为识别数据集分别进行归一化处理、多尺度缩放处理、旋转增强处理,包括:根据下式(2)对归一化后的所述原始行为识别数据集进行多尺度缩放处理:其中,fx和fy分别表示x轴和y轴的焦距,x和y分别表示归一化后的所述原始行为识别数据集中图像的宽和高,x′和y′分别表示多尺度缩放后的所述原始行为识别数据集中图像的宽和高。5.根据权利要求4所述的训练方法,其特征在于,所述对所述原始行为识别数据集分别进行归一化处理、多尺度缩放处理、旋转增强处理,包括:根据下式(3)对多尺度缩放处理后的所述原始行为识别数据集进行旋转增强处理:其中,α表示旋转的角度,w′和h′分别表示旋转增强后的所述原始行为识别数据集中图像的宽和高。6.根据权利要求1至5任一项所述的训练方法,其特征在于,所述对数据增强后的所述原始行为识别数据集进行裁剪处理,得到目标数据集,包括:根据数据增强后的所述原始行为识别数据集对应的标注文件,提取目标框信息;根据预设的数据增强流程,对所述目标框信息进行相应转换;根据转换后的目标框信息,对数据增强后的所述原始行为识别数据集进行裁剪,得到所述目标数据集。2CN115984651A权利要求书2/2页7.根据权利要求1至5任一项所述的训练方法,其特征在于,所述构建基于自监督学习的目标检测模型,包括:构建基于MOCOV3的自监督学习框架,并采用ResNet‑50模型作为所述自监督学习框架对应的骨干模型,得到第一模型;根据下式(4)将所述第一模型包括的所述自监督学习框架中的动量编码器方式更改为指数加权移动平均算法,得到第二模型,其中,θm表示所述自监督学习框架中的key编码器的参数,θ表示所述自监督学习框架中的query编码器的参数,β∈[0,1]表示动量系数:θm=β×θm+(1‑β)×θ(4)根据下式(5)将所述第二模型的编码器输出转换为预测输出,得到所述目标检测自监督模型:prediction=p(fθ(i))(5)其中,prediction表示分类结果,p表示预测器,fθ表示以θ为参数的query编码器,i表示所述原始行为识别数据集中的图像数据;采用YOLOX网络作为目标检测框架