预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114998678A(43)申请公布日2022.09.02(21)申请号202210583640.4G06T7/246(2017.01)(22)申请日2022.05.25G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人陈子亮(74)专利代理机构北京易光知识产权代理有限公司11596专利代理师王姗姗武晨燕(51)Int.Cl.G06V10/774(2022.01)G06V10/74(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)G06V20/40(2022.01)权利要求书4页说明书12页附图6页(54)发明名称模型训练方法、目标跟踪方法、装置(57)摘要本公开提供了一种模型训练方法、目标跟踪方法、装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术等领域,可应用于光学字符识别(OpticalCharacterRecognition,OCR)等场景。具体实现方案为:根据图文数据对第一模型进行第一预训练,得到第一模型在第二预训练中加载的预训练参数,根据第一图像样本集合及第二图像样本集合,构建训练数据,根据训练数据和预训练参数对第一模型进行第二预训练,得到第二模型。采用本公开,提高了模型精度。CN114998678ACN114998678A权利要求书1/4页1.一种模型训练方法,包括:根据图文数据对第一模型进行第一预训练,得到所述第一模型在第二预训练中加载的预训练参数;根据第一图像样本集合及第二图像样本集合,构建训练数据;根据所述训练数据和所述预训练参数对所述第一模型进行第二预训练,得到第二模型。2.根据权利要求1所述的方法,其中,所述预训练参数,用于表征由所述图文数据得到的目标对象类别。3.根据权利要求1或2所述的方法,其中,所述根据图文数据对第一模型进行第一预训练,得到所述第一模型在第二预训练中加载的预训练参数,包括:从所述图文数据中提取第一图像数据及与所述第一图像数据对应的第一文本数据;将所述第一图像数据及所述第一文本数据输入所述第一模型;根据所述第一图像数据及所述第一文本数据之间的映射关系进行所述第一预训练,得到所述预训练参数。4.根据权利要求3所述的方法,其中,所述根据所述第一图像数据及所述第一文本数据之间的映射关系进行所述第一预训练,得到所述预训练参数,包括:在所述第一模型中,根据所述第一图像数据及所述第一文本数据之间的映射关系得到第一预训练目标;根据所述第一预训练目标进行所述第一预训练,对所述第一模型中的映射模块进行参数调整,得到所述预训练参数。5.根据权利要求4所述的方法,其中,在所述第一模型中,根据所述第一图像数据及所述第一文本数据之间的映射关系得到第一预训练目标,包括:将所述第一图像数据输入所述第一模型的第一处理分支,对所述第一图像数据进行特征提取,得到第一图像特征;将所述第一文本数据输入所述第一模型的第二处理分支,对所述第一文本数据进行特征提取,得到第一文本特征;将所述第一图像特征及所述第一文本特征分别进行映射处理,并映射到同一个目标特征空间中,得到在所述同一个目标特征空间中所述第一图像数据及所述第一文本数据之间的映射关系;根据在所述同一个目标特征空间中所述第一图像数据及所述第一文本数据之间的映射关系,得到所述第一预训练目标。6.根据权利要求5所述的方法,其中,所述根据所述训练数据和所述预训练参数对所述第一模型进行第二预训练,得到第二模型,包括:从所述训练数据中提取第一图像样本数据及第二图像样本数据;将所述第一图像样本数据及所述第二图像样本数据输入所述第一模型,在所述第一模型中的所述映射模块加载所述预训练参数的情况下对所述第一模型进行所述第二预训练,得到所述第二模型。7.根据权利要求6所述的方法,还包括:通过在所述第一模型中的所述映射模块加载所述预训练参数,得到先验信息;2CN114998678A权利要求书2/4页在所述第一模型中,根据所述先验信息确定所述第一图像样本数据与所述第二图像样本数据中的待跟踪对象类别;其中,所述先验信息包括:通过所述同一个目标特征空间中所述第一图像数据及所述第一文本数据之间的映射关系所指示的类别标签。8.根据权利要求7所述的方法,其中,所述将所述第一图像样本数据及所述第二图像样本数据输入所述第一模型,在所述第一模型中的所述映射模块加载所述预训练参数的情况下对所述第一模型进行所述第二预训练,得到所述第二模型,包括:将所述第一图像样本数据输入所述第一模型的第一处理分支,对所述第一图像样本数据进行特征提取,得到第一图像样本特征;将所述第二图像