预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110458243A(43)申请公布日2019.11.15(21)申请号201910760045.1(22)申请日2019.08.16(71)申请人北京金山数字娱乐科技有限公司地址100085北京市海淀区小营西路33号金山软件大厦2层西区申请人成都金山数字娱乐科技有限公司(72)发明人史红亮廖敏鹏李长亮(74)专利代理机构北京智信禾专利代理有限公司11637代理人王治东(51)Int.Cl.G06K9/62(2006.01)G06T9/00(2006.01)权利要求书3页说明书11页附图7页(54)发明名称图像识别模型的训练方法及装置、图像识别方法及装置(57)摘要本申请提供图像识别模型的训练方法及装置、图像识别方法及装置,其中所述图像识别模型的训练方法包括:获取预训练的图像识别模型和样本数据,其中,所述样本数据包括图像和所述图像对应的真值序列;将所述样本数据中的图像输入所述图像识别模型,使用随机策略获取随机策略序列,使用确定策略获取确定策略序列;根据所述随机策略序列、所述确定策略序列和所述样本数据中图像对应的真值序列计算损失值;通过对所述损失值进行反向传播以训练所述图像识别模型。增强图像识别模型的训练,提高图像识别模型的训练效率。CN110458243ACN110458243A权利要求书1/3页1.一种图像识别模型的训练方法,其特征在于,包括:获取预训练的图像识别模型和样本数据,其中,所述样本数据包括图像和所述图像对应的真值序列;将所述样本数据中的图像输入所述图像识别模型,使用随机策略获取随机策略序列,使用确定策略获取确定策略序列;根据所述随机策略序列、所述确定策略序列和所述样本数据中图像对应的真值序列计算损失值;通过对所述损失值进行反向传播以训练所述图像识别模型。2.如权利要求1所述的图像识别模型的训练方法,其特征在于,使用随机策略获取随机策略序列,包括:S21、将所述图像在所述图像识别模型的编码端进行编码,获得所述图像的编码向量;S22、将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集;S23、使用随机策略在所述解码字符集中随机选取解码字符;S24、判断所述图像识别模型的解码端是否完成解码,若是,则执行S25,若否,执行S21;S25、根据随机选取的解码字符生成随机策略序列。3.如权利要求1所述的图像识别模型的训练方法,其特征在于,使用确定策略获取确定策略序列,包括:S31、将所述图像在所述图像识别模型的编码端进行编码,获得所述图像的编码向量;S32、将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集;S33、使用确定策略在所述解码字符集中选取最大概率的解码字符;S34、判断所述图像识别模型的解码端是否完成解码,若是,则执行S35,若否,执行S31;S35、根据最大概率选取的解码字符生成确定策略序列。4.如权利要求2或3所述的图像识别模型的训练方法,其特征在于,将所述图像的编码向量在所述图像识别模型的解码端进行解码,生成解码字符集,包括:将上一次的输出作为参考编码向量输入至所述图像识别模型的解码端,解码端根据所述参考编码向量和所述图像的编码向量生成当前次的解码字符集。5.如权利要求1所述的图像识别模型的训练方法,其特征在于,根据所述随机策略序列、所述确定策略序列和所述样本数据中图像对应的真值序列计算损失值,包括:将所述随机策略序列和所述样本数据中图像对应的真值序列通过编辑距离计算奖励,获取随机策略奖励;将所述确定策略序列和所述样本数据中图像对应的真值序列通过编辑距离计算奖励,获取确定策略奖励;根据所述随机策略奖励、所述确定策略奖励和所述随机策略序列计算损失值。6.如权利要求5所述的图像识别模型的训练方法,其特征在于,通过对所述损失值进行反向传播以训练所述图像识别模型,包括:在损失值大于预设阈值范围最大值的情况下,所述随机策略奖励大于所述确定策略奖励,所述图像识别模型增加获取随机策略解码序列的参数权重;2CN110458243A权利要求书2/3页在损失值小于预设阈值范围最小值的情况下,所述随机策略奖励小于所述确定策略奖励,所述图像识别模型减少获取随机策略解码序列的参数权重。7.如权利要求5所述的图像识别模型的训练方法,其特征在于,通过对所述损失值进行反向传播以训练所述图像识别模型,包括:在损失值在预设阈值范围内的情况下,停止训练所述图像识别模型。8.一种图像识别方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入预先训练好的图像识别模型,所述图像识别模型被训练于根据输入的图像获取所述图像的描述信息;所述图像识别模型响应于所述待识别图像作为输入而获取所述待识别图像的描述信息。9.如权利要求8所述的图