预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113762292A(43)申请公布日2021.12.07(21)申请号202010493777.1(22)申请日2020.06.03(71)申请人杭州海康威视数字技术股份有限公司地址310051浙江省杭州市滨江区阡陌路555号(72)发明人唐苗许江浩任国焘洪文杰师文靖(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙)11413代理人马敬丁芸(51)Int.Cl.G06K9/62(2006.01)G06K9/32(2006.01)权利要求书3页说明书19页附图3页(54)发明名称一种训练数据获取方法、装置及模型训练方法、装置(57)摘要本申请实施例提供了一种训练数据获取方法、装置及模型训练方法、装置。其中,所述方法包括:获取预设第一格式的训练数据全量信息;对所述训练数据全量信息进行格式转化,得到预设第二格式的检测训练数据;获取目标子图像的第二标识信息;对所述训练数据全量信息进行格式转化,得到预设第三格式的识别训练数据。可以通过格式转化将训练数据全量信息的信息分别转化成训练检测模型所需的信息和以及训练识别模型所需的信息,即通过对检测训练数据和识别训练数据中不同字段中的信息进行融合,降低所需获取的训练数据中信息的冗余度,有效降低所需获取的用于训练数据的数据量,因此可以有效降低获取训练数据所花费的时间,提高模型训练的效率。CN113762292ACN113762292A权利要求书1/3页1.一种训练数据获取方法,其特征在于,所述方法包括:获取预设第一格式的训练数据全量信息,所述预设第一格式中设置有第一标识字段、第一位置字段和第一真值字段,所述训练数据全量信息中所述第一标识字段携带有第一标识信息,所述第一位置字段携带有位置信息,所述第一真值字段携带有真值信息,其中,所述标识信息用于标识样本图像,所述位置信息用于表示所述标识信息所标识的样本图像中存在目标的图像区域,所述真值信息用于表示所述位置信息所表示的图像区域内存在的目标的真值;对所述训练数据全量信息进行格式转化,得到预设第二格式的检测训练数据,所述预设第二格式中设置有第二标识字段和第二位置字段,所述第二标识字段用于标识训练检测模型所使用的样本图像,所述第二位置字段用于表示训练所述检测模型时所述第二标识字段所标识的样本图像的真值,所述检测训练数据中所述第二标识字段中携带有所述第一标识信息,所述第二位置字段携带有所述位置信息;获取目标子图像的第二标识信息,所述目标子图像为包括所述第一标识信息所标识的样本图像中所述位置信息所表示的图像区域内的图像;对所述训练数据全量信息进行格式转化,得到预设第三格式的识别训练数据,所述预设第三格式中设置有第三标识字段、第三位置字段以及第二真值字段,所述第三标识字段用于标识训练识别模型所使用的样本图像,所述第三位置字段用于表示所述第三标识字段所标识的样本图像中存在目标的图像区域,所述第二真值字段用于表示训练所述识别模型时所述第三标识字段所标识的样本图像的真值,所述识别训练数据中所述第三标识字段携带有所述第二标识信息,所述第三位置字段携带有所述位置信息,所述第二真值字段携带有所述真值信息。2.根据权利要求1所述的方法,其特征在于,所述对所述训练数据全量信息进行格式转化,得到预设第二格式的检测训练数据,包括:删除所述训练数据全量信息中的第一真值字段;将删除后的训练数据全量信息中的第一标识字段转化为预设第二格式中的第二标识字段,将第一位置字段转化为所述预设第二格式中的第二位置字段,得到所述预设第二格式的检测训练数据。3.根据权利要求1所述的方法,其特征在于,所述对所述训练数据全量信息进行格式转化,得到预设第三格式的识别训练数据,包括:将所述训练数据全量信息中的第一标识字段所携带的信息更新为所述第二标识信息;将更新后的训练数据全量信息中的第一标识字段转化为预设第三格式中的第三标识字段,将第一位置字段转化为所述预设第三格式中的第三位置字段,将第一真值字段转化为所述第三格式中的第二真值字段,得到所述预设第三格式的识别训练数据。4.根据权利要求3所述的方法,其特征在于,所述真值信息为真值序列,所述真值序列中第i个元素用于表示所述位置信息所表示的图像区域内按照预设规则排序的第i个目标的真值,i为不小于1且不大于所述真值序列长度的任一正整数;所述预设第三格式中的所述第二真值字段包括多个子字段,其中,每个子字段用于表示训练所述识别模型时所述第三标识字段所标识的样本图像中一个目标的真值;所述将第一真值字段转化为所述预设第三格式中的第二真值字段,包括:2CN113762292A权利要求书2/3页将第一真值字段分割为所述预设第三格式中所述第二真值字段的多个子字段,其中,每个子字段携带有所述真值序